- Страна
- Россия
Откликайтесь
на вакансии с ИИ

ML-инженер в команду аудиоязыковых моделей
Это исключительная возможность работать в топовой технологической компании над передовыми задачами в области ИИ. Вакансия предлагает работу с современным стеком (LLM, мультимодальность) и отличный социальный пакет Яндекса.
Сложность вакансии
Вакансия требует глубоких знаний в области LLM и мультимодальных моделей, а также умения работать с современными методами посттрейна (GRPO, DPO). Высокий порог входа обусловлен необходимостью сочетать сильные исследовательские навыки с качественной инженерной реализацией на больших масштабах.
Анализ зарплаты
Яндекс обычно предлагает зарплаты на уровне или выше верхнего дециля рынка для ML-специалистов такого уровня, дополняя их значительным пакетом бонусов и опционов. Указанные рыночные оценки соответствуют уровню Senior ML Engineer в России.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Яндекс уже сейчас
Присоединяйтесь к команде Яндекса и создавайте аудиоязыковые модели нового поколения для Алисы!
Описание вакансии
*🔎 ML-инженер в команду аудиоязыковых моделей*
Наша команда обучает аудиоязыковые модели нового поколения. Мы хотим, чтобы одна модель могла понимать звучащий вокруг мир: речь, интонацию, настроение собеседника, фоновые события, музыку, шумы и другие сигналы. Ищем ML-инженера, который сможет влиять на архитектуру, обучение и качество моделей: от исследовательских гипотез до работающих пайплайнов.
Какие задачи вас ждут:
• Обучение аудиоязыковых моделейУчаствовать в полном цикле обучения моделей: претрейне, SFT и GRPO. Проектировать эксперименты, анализировать качество, находить слабые места моделей и улучшать их на сложных срезах данных.
• Исследование архитектур и рецептов обученияРазбираться в современных подходах к LLM, audio encoders, speech/audio understanding, multimodal alignment и обучению моделей по reward-сигналам. Следить за развитием области, обсуждать идеи с командой и проверять гипотезы.
• Работа с данными и метриками качестваУчаствовать в построении датасетов, формулировать задачи для обучения и оценки, выбирать метрики для разных сценариев.
• Развитие исследовательской и инженерной инфраструктурыСледить за качеством реализации: воспроизводимые эксперименты, эффективные пайплайны, стабильное обучение, анализ логов, оптимизация узких мест и аккуратная работа с большими вычислениями.
Мы ждём, что вы:• Обучали LLM или мультимодальные модели
• Понимаете полный цикл ML-разработки
• Умеете разбираться в ML-статьях, формулировать на их основе гипотезы, проводить эксперименты и делать выводы
• Готовы отвечать за направление, архитектурные решения или крупный исследовательский трек
Будет плюсом, если вы:• Работали с аудио, речевыми технологиями, ASR, TTS, speaker/audio understanding или audio representation learning
• Обучали мультимодальные модели или применяли SFT, RLHF, DPO, GRPO и другие методы посттрейна
Наши бонусы:Мы заботимся о детях яндексоидов и устраиваем детские дни в офисе. Это не все бонусы — полный список тут.
*📩* Откликнуться на нашем сайте
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- LLM
- Multimodal Models
- SFT
- GRPO
- Audio Encoders
- Speech Understanding
- Audio Understanding
- Multimodal Alignment
- RLHF
- DPO
- ASR
- TTS
- Python
- PyTorch
Возможные вопросы на собеседовании
Проверка понимания специфики обучения моделей на основе вознаграждения, упомянутого в вакансии.
В чем заключаются ключевые отличия алгоритма GRPO от стандартного PPO при обучении языковых моделей?
Оценка опыта работы с мультимодальностью, что является ядром данной роли.
Какие подходы к мультимодальному выравниванию (alignment) между аудио-энкодером и LLM вы считаете наиболее эффективными и почему?
Проверка практических навыков работы с аудиоданными.
С какими основными проблемами вы сталкивались при обучении аудио-энкодеров и как решали вопрос нехватки размеченных данных?
Оценка инженерной зрелости кандидата.
Как вы организуете процесс мониторинга и анализа логов при обучении моделей на больших кластерах для выявления деградации качества?
Проверка способности работать с научной литературой.
Расскажите о последней прочитанной вами статье в области Speech/Audio Understanding: какую гипотезу вы бы предложили проверить на её основе?
Похожие вакансии
Python разработчик (DWH/Data Engineering)
Data Scientist Middle+, Senior
Data Scientist
Data Engineer
Middle+ Data инженер
Backend / ML Infrastructure / MLOps инженер
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!