yandex
С
Сбер
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
ГибридПолная занятость

Дата-инженер в команду SberAI

ИИОценка ИИ

Отличная вакансия в топовой AI-лаборатории страны с сильным соцпакетом (ипотека, ДМС, премии) и работой над передовыми GenAI-технологиями. Гибридный формат и современный офис добавляют привлекательности.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Роль требует уверенного владения Python и SQL, а также специфического опыта работы с ML-пайплайнами и мультимодальными данными (CV/NLP). Высокая планка обусловлена необходимостью работы с большими данными в экосистеме Сбера и использованием инструментов оркестрации.

Анализ зарплаты

Медиана280 000 ₽
Рынок200 000 ₽ – 400 000 ₽
ИИОценка ИИ

Зарплата в объявлении не указана, но для позиций Data Engineer в SberAI рыночные вилки обычно соответствуют или превышают средние показатели по Москве для Middle/Senior уровней. Наличие годовых премий и льготной ипотеки значительно повышает совокупный доход.

Сопроводительное письмо

Меня заинтересовала вакансия дата-инженера в SberAI, так как я обладаю опытом работы с мультимодальными данными и построением сложных ETL-пайплайнов. Мой стек технологий, включающий Python, SQL и Airflow, полностью совпадает с вашими требованиями, а опыт работы с Docker и Kubernetes позволит мне быстро интегрироваться в процессы разработки.

Особенно меня привлекает возможность работать над задачами для GenAI-моделей, такими как фильтрация контента и оценка эстетики данных. Я уверен, что мои навыки в области обработки данных для CV и NLP помогут вашей команде поставлять еще более качественные датасеты для обучения прорывных моделей. Буду рад обсудить мой опыт на интервью.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Сбер уже сейчас

Станьте частью команды SberAI и создавайте будущее генеративного ИИ вместе с лидерами рынка!

Описание вакансии

🔥 Присоединяйся к дата-инженерной команде Управления экспериментальных систем машинного обучения SberAI — собираем данные для прорывных GenAI-моделей

Привет! 👋 Мы — дата-инженерная команда внутри Управления экспериментальных систем машинного обучения SberAI. Наша миссия — поставлять качественные мультимодальные датасеты в продуктовые команды, которые развивают генеративные модели: speech, music, image, video, 3D, text.

Чем будешь заниматься на самом деле:

🔍 Парсить открытые источники

⚙️ Оркестрировать ETL/ELT-пайплайны, фильтровать дубли, блюр, водяные знаки, нелегальный контент, оценивать реалистичность и эстетику.

👥 Организовывать проекты ручного сбора и валидации на крауд-платформах TagMe, Elementary, ЯЗ.

Наш стек: 🛠

Python • SQL • S3 • Hadoop/GreenPlum • Airflow • Docker/K8s • Git • Vault • ML Space • Confluence • Jira

Что нужно, чтобы стать своим:

✅ Знание Python (библиотеки для работы с данными и API)

✅ Опыт с ML-пайплайнами и датасетами для CV/NLP

✅ Понимание ETL/ELT и жизненного цикла данных

✅ SQL: SELECT, JOIN, агрегаты, подзапросы

✅ Базовое понимание форматов: CSV, JSON, Parquet, сериализация

✅ Опыт с Docker/Kubernetes

Будет плюсом: 🌟

Airflow или другие оркестраторы

Понимание облачных сервисов

Почему тебе здесь понравится:

📍 Офис и формат: современный офис рядом с м. Кутузовская + гибридный график. Хочешь из дома — ок, хочешь в офис с корпоративным спортзалом и зонами отдыха — пожалуйста.

💰 Деньги и стабильность: ежегодный пересмотр зарплаты + годовая премия.

🏠 Ипотека для сотрудников — реальная возможность решить жилищный вопрос.

🩺 Забота о здоровье: расширенный ДМС с первого дня работы + страхование для семьи.

🎁 Бонусы: бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров, вознаграждение за рекомендацию друзей в команду Сбера.

📚 Рост: система обучения для профессионального и карьерного развития.

Как попасть в команду? 🚀

Откликайся по ссылке: Откликнуться

Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Git
  • Python
  • SQL
  • Kubernetes
  • Computer Vision
  • NLP
  • Docker
  • Airflow
  • Hadoop
  • ETL
  • JSON
  • S3
  • ELT
  • Parquet
  • Greenplum

Возможные вопросы на собеседовании

Проверка навыков обработки данных и владения библиотеками Python.

Какие библиотеки Python вы используете для парсинга данных и последующей очистки мультимодальных датасетов?

Оценка понимания специфики работы с изображениями и видео для обучения моделей.

Как бы вы реализовали автоматизированный пайплайн для фильтрации дублей и водяных знаков в наборе из миллионов изображений?

Проверка опыта работы с инструментами оркестрации, указанными в стеке.

Опишите ваш опыт работы с Airflow: как вы обрабатываете ошибки в DAG и обеспечиваете идемпотентность задач?

Оценка навыков работы с распределенными системами хранения.

В чем заключаются основные различия при работе с данными в S3 и Hadoop/GreenPlum с точки зрения дата-инженера?

Проверка умения работать с краудсорсинговыми платформами для разметки.

Был ли у вас опыт постановки задач на крауд-платформах (например, TagMe или Яндекс.Задания)? Как вы контролируете качество разметки?

Похожие вакансии

NDA
2 000 ₽ – 2 500 ₽

ML разработчик (Senior)

SeniorУдалённо
n8n · Generative AI · Python · JavaScript · TypeScript · React · LangChain · PostgreSQL · REST · GraphQL · FastAPI · RAG · Vector Database · Prompt Engineering
+14 навыков
КС
КВИКЛИ СЕЧ ИТ
300 000 ₽ – 450 000 ₽

Senior / Middle+ Data Scientist

SeniorУдалённо
Python · Apache Spark · Machine Learning · Recommendation Systems · Ranking · NLP · LLM · MLOps · A/B Testing · Uplift Modeling
+10 навыков
S
Selecty
220 000 ₽ – 310 000 ₽

MlOps / Python Backend Engineer (ML)

SeniorУдалённо
Python · FastAPI · Flask · Kafka · Docker · Kubernetes · Airflow · Spark · Hive · SQL · MLOps · NLP · Computer Vision
+13 навыков
NDA
от 2 000 ₽

Data Scientist Senior

SeniorУдалённо
Python · Pandas · NumPy · Matplotlib · Seaborn · Plotly · Scikit-learn · SciPy · statsmodels · CatBoost · XGBoost · LightGBM · ARIMA · Prophet · Deep Learning · CNN · RNN · LSTM · Attention · Feature Engineering · tsfresh · EDA
+22 навыков
NDA
168 358 ₽ – 297 075 ₽

ML разработчик (Middle)

MiddleУдалённо
Python · Scikit-learn · Pandas · NumPy · PyTorch · TensorFlow · JAX · SQL · Spark · PySpark · Dask · Docker · Kubernetes · Git · DVC · GitLab CI · GitHub Actions · Jenkins · Prometheus · Grafana · Evidently AI · MLflow · AWS · GCP · Azure ML · Kubeflow · Airflow · FastAPI · Flask · Triton Inference Server · Feast · Tecton · Hopsworks · Horovod · Ray
+35 навыков
C
Centicore
340 000 ₽ – 360 000 ₽

Senior Data Scientist

SeniorУдалённо
Python · Machine Learning · Uplift Modeling · LightGBM · XGBoost · CatBoost · Scikit-learn · Pandas · NumPy · SQL · Apache Spark · Hadoop · Apache Hive · MLOps
+14 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

С
Сбер
Россия