yandex
С
Сбер
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
ГибридПолная занятость

Дата-инженер в команду SberAI

Оценка ИИ

Отличная вакансия в топовой AI-лаборатории страны с сильным соцпакетом (ипотека, ДМС, премии) и работой над передовыми GenAI-технологиями. Гибридный формат и современный офис добавляют привлекательности.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Роль требует уверенного владения Python и SQL, а также специфического опыта работы с ML-пайплайнами и мультимодальными данными (CV/NLP). Высокая планка обусловлена необходимостью работы с большими данными в экосистеме Сбера и использованием инструментов оркестрации.

Анализ зарплаты

Медиана280 000 ₽
Рынок200 000 ₽ – 400 000 ₽
Оценка ИИ

Зарплата в объявлении не указана, но для позиций Data Engineer в SberAI рыночные вилки обычно соответствуют или превышают средние показатели по Москве для Middle/Senior уровней. Наличие годовых премий и льготной ипотеки значительно повышает совокупный доход.

Сопроводительное письмо

Меня заинтересовала вакансия дата-инженера в SberAI, так как я обладаю опытом работы с мультимодальными данными и построением сложных ETL-пайплайнов. Мой стек технологий, включающий Python, SQL и Airflow, полностью совпадает с вашими требованиями, а опыт работы с Docker и Kubernetes позволит мне быстро интегрироваться в процессы разработки.

Особенно меня привлекает возможность работать над задачами для GenAI-моделей, такими как фильтрация контента и оценка эстетики данных. Я уверен, что мои навыки в области обработки данных для CV и NLP помогут вашей команде поставлять еще более качественные датасеты для обучения прорывных моделей. Буду рад обсудить мой опыт на интервью.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Сбер уже сейчас

Станьте частью команды SberAI и создавайте будущее генеративного ИИ вместе с лидерами рынка!

Описание вакансии

🔥 Присоединяйся к дата-инженерной команде Управления экспериментальных систем машинного обучения SberAI — собираем данные для прорывных GenAI-моделей

Привет! 👋 Мы — дата-инженерная команда внутри Управления экспериментальных систем машинного обучения SberAI. Наша миссия — поставлять качественные мультимодальные датасеты в продуктовые команды, которые развивают генеративные модели: speech, music, image, video, 3D, text.

Чем будешь заниматься на самом деле:

🔍 Парсить открытые источники

⚙️ Оркестрировать ETL/ELT-пайплайны, фильтровать дубли, блюр, водяные знаки, нелегальный контент, оценивать реалистичность и эстетику.

👥 Организовывать проекты ручного сбора и валидации на крауд-платформах TagMe, Elementary, ЯЗ.

Наш стек: 🛠

Python • SQL • S3 • Hadoop/GreenPlum • Airflow • Docker/K8s • Git • Vault • ML Space • Confluence • Jira

Что нужно, чтобы стать своим:

✅ Знание Python (библиотеки для работы с данными и API)

✅ Опыт с ML-пайплайнами и датасетами для CV/NLP

✅ Понимание ETL/ELT и жизненного цикла данных

✅ SQL: SELECT, JOIN, агрегаты, подзапросы

✅ Базовое понимание форматов: CSV, JSON, Parquet, сериализация

✅ Опыт с Docker/Kubernetes

Будет плюсом: 🌟

Airflow или другие оркестраторы

Понимание облачных сервисов

Почему тебе здесь понравится:

📍 Офис и формат: современный офис рядом с м. Кутузовская + гибридный график. Хочешь из дома — ок, хочешь в офис с корпоративным спортзалом и зонами отдыха — пожалуйста.

💰 Деньги и стабильность: ежегодный пересмотр зарплаты + годовая премия.

🏠 Ипотека для сотрудников — реальная возможность решить жилищный вопрос.

🩺 Забота о здоровье: расширенный ДМС с первого дня работы + страхование для семьи.

🎁 Бонусы: бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров, вознаграждение за рекомендацию друзей в команду Сбера.

📚 Рост: система обучения для профессионального и карьерного развития.

Как попасть в команду? 🚀

Откликайся по ссылке: Откликнуться

Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • SQL
  • S3
  • Hadoop
  • Greenplum
  • Airflow
  • Docker
  • Kubernetes
  • Git
  • ETL
  • ELT
  • NLP
  • Computer Vision
  • JSON
  • Parquet

Возможные вопросы на собеседовании

Проверка навыков обработки данных и владения библиотеками Python.

Какие библиотеки Python вы используете для парсинга данных и последующей очистки мультимодальных датасетов?

Оценка понимания специфики работы с изображениями и видео для обучения моделей.

Как бы вы реализовали автоматизированный пайплайн для фильтрации дублей и водяных знаков в наборе из миллионов изображений?

Проверка опыта работы с инструментами оркестрации, указанными в стеке.

Опишите ваш опыт работы с Airflow: как вы обрабатываете ошибки в DAG и обеспечиваете идемпотентность задач?

Оценка навыков работы с распределенными системами хранения.

В чем заключаются основные различия при работе с данными в S3 и Hadoop/GreenPlum с точки зрения дата-инженера?

Проверка умения работать с краудсорсинговыми платформами для разметки.

Был ли у вас опыт постановки задач на крауд-платформах (например, TagMe или Яндекс.Задания)? Как вы контролируете качество разметки?

Похожие вакансии

более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

С
Сбер
Страна
Россия