- Страна
- Россия
Откликайтесь
на вакансии с ИИ

Дата-инженер в команду SberAI
Отличная вакансия в топовой AI-лаборатории страны с сильным соцпакетом (ипотека, ДМС, премии) и работой над передовыми GenAI-технологиями. Гибридный формат и современный офис добавляют привлекательности.
Сложность вакансии
Роль требует уверенного владения Python и SQL, а также специфического опыта работы с ML-пайплайнами и мультимодальными данными (CV/NLP). Высокая планка обусловлена необходимостью работы с большими данными в экосистеме Сбера и использованием инструментов оркестрации.
Анализ зарплаты
Зарплата в объявлении не указана, но для позиций Data Engineer в SberAI рыночные вилки обычно соответствуют или превышают средние показатели по Москве для Middle/Senior уровней. Наличие годовых премий и льготной ипотеки значительно повышает совокупный доход.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Сбер уже сейчас
Станьте частью команды SberAI и создавайте будущее генеративного ИИ вместе с лидерами рынка!
Описание вакансии
🔥 Присоединяйся к дата-инженерной команде Управления экспериментальных систем машинного обучения SberAI — собираем данные для прорывных GenAI-моделей
Привет! 👋 Мы — дата-инженерная команда внутри Управления экспериментальных систем машинного обучения SberAI. Наша миссия — поставлять качественные мультимодальные датасеты в продуктовые команды, которые развивают генеративные модели: speech, music, image, video, 3D, text.
Чем будешь заниматься на самом деле:
🔍 Парсить открытые источники
⚙️ Оркестрировать ETL/ELT-пайплайны, фильтровать дубли, блюр, водяные знаки, нелегальный контент, оценивать реалистичность и эстетику.
👥 Организовывать проекты ручного сбора и валидации на крауд-платформах TagMe, Elementary, ЯЗ.
Наш стек: 🛠
Python • SQL • S3 • Hadoop/GreenPlum • Airflow • Docker/K8s • Git • Vault • ML Space • Confluence • Jira
Что нужно, чтобы стать своим:
✅ Знание Python (библиотеки для работы с данными и API)
✅ Опыт с ML-пайплайнами и датасетами для CV/NLP
✅ Понимание ETL/ELT и жизненного цикла данных
✅ SQL: SELECT, JOIN, агрегаты, подзапросы
✅ Базовое понимание форматов: CSV, JSON, Parquet, сериализация
✅ Опыт с Docker/Kubernetes
Будет плюсом: 🌟
Airflow или другие оркестраторы
Понимание облачных сервисов
Почему тебе здесь понравится:
📍 Офис и формат: современный офис рядом с м. Кутузовская + гибридный график. Хочешь из дома — ок, хочешь в офис с корпоративным спортзалом и зонами отдыха — пожалуйста.
💰 Деньги и стабильность: ежегодный пересмотр зарплаты + годовая премия.
🏠 Ипотека для сотрудников — реальная возможность решить жилищный вопрос.
🩺 Забота о здоровье: расширенный ДМС с первого дня работы + страхование для семьи.
🎁 Бонусы: бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров, вознаграждение за рекомендацию друзей в команду Сбера.
📚 Рост: система обучения для профессионального и карьерного развития.
Как попасть в команду? 🚀
Откликайся по ссылке: Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- SQL
- S3
- Hadoop
- Greenplum
- Airflow
- Docker
- Kubernetes
- Git
- ETL
- ELT
- NLP
- Computer Vision
- JSON
- Parquet
Возможные вопросы на собеседовании
Проверка навыков обработки данных и владения библиотеками Python.
Какие библиотеки Python вы используете для парсинга данных и последующей очистки мультимодальных датасетов?
Оценка понимания специфики работы с изображениями и видео для обучения моделей.
Как бы вы реализовали автоматизированный пайплайн для фильтрации дублей и водяных знаков в наборе из миллионов изображений?
Проверка опыта работы с инструментами оркестрации, указанными в стеке.
Опишите ваш опыт работы с Airflow: как вы обрабатываете ошибки в DAG и обеспечиваете идемпотентность задач?
Оценка навыков работы с распределенными системами хранения.
В чем заключаются основные различия при работе с данными в S3 и Hadoop/GreenPlum с точки зрения дата-инженера?
Проверка умения работать с краудсорсинговыми платформами для разметки.
Был ли у вас опыт постановки задач на крауд-платформах (например, TagMe или Яндекс.Задания)? Как вы контролируете качество разметки?
Похожие вакансии
Team Lead MLOps / Tech Lead
Data Science / ML Engineer
Data инженер Middle+ Senior
Data инженер Middle
AI/ML Engineer
Senior Data Engineer
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Россия