- Страна
- Россия
Откликайтесь
на вакансии с ИИ

Старший LLM-разработчик в команду рассуждений YandexGPT
Это топовая позиция в одной из ведущих технологических компаний России. Работа над флагманским продуктом (YandexGPT) с доступом к огромным вычислительным ресурсам и сильной командой делает эту вакансию максимально привлекательной для ML-специалиста.
Сложность вакансии
Роль требует глубокой экспертизы в области LLM, RLHF и современных алгоритмов обучения. Задачи связаны с R&D на переднем крае технологий, что подразумевает высокий порог входа и необходимость владения SOTA-методами.
Анализ зарплаты
Зарплаты для Senior LLM-разработчиков в крупных российских тех-гигантах обычно находятся в верхнем сегменте рынка, часто превышая средние показатели за счет премий и опционов. Указанный диапазон отражает текущие рыночные реалии для специалистов такого уровня в Москве.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Яндекс уже сейчас
Присоединяйтесь к команде YandexGPT и создавайте будущее LLM-рассуждений в Яндексе!
Описание вакансии
*❣️ Старший LLM-разработчик в команду рассуждений YandexGPT*
Наша команда улучшает способности к рассуждениям семейства моделей Alice AI LLM. Мы стремимся создать единую модель, объединяющую сильные стороны рассуждений, использование внешних функций и поисковые возможности наших сервисов.
Какие задачи вас ждут:
• Развитие базовых reasoning-способностей YandexGPTБлижайшая цель — научиться эффективнее масштабировать RLVR- и RLHF-обучение reasoning-моделей для B2C‑задач широкого круга пользователей. Вас ждут эксперименты по улучшению общих свойств модели (полезность, логичность, структура) за счёт повышения качества цепочек рассуждений и усиления паттернов (backtracking, верификация) на задачах разной тематики.
• Объединение сигналов в общей моделиМы стремимся создать новые этапы алайнмента и системы наград, которые позволят совместить сигналы на математических и научных задачах вместе с креативными, повысив качество рассуждений в каждой области по сравнению с независимым обучением. Вам предстоит проводить исследования с новыми reward‑моделями, этапами и дистилляцией в рамках единой модели.
• Эксперименты с RL-алгоритмамиВы будете искать SOTA-подходы, которые приносят пользу реальному продукту: экспериментировать с RL‑алгоритмами, тестировать методы стабилизации обучения Dense‑ и MoE‑архитектур.
Мы ждём, что вы:• Отлично разбираетесь в NLP и классическом ML
• Владеете Python
• Понимаете, как устроены современные LLM, решали с их помощью прикладные задачи или имеете релевантный исследовательский опыт
Наши бонусы:Мы заботимся о детях яндексоидов и устраиваем детские дни в офисе. Это не все бонусы — полный список тут.
*📩* Откликнуться на нашем сайте
#генеративные_технологии #ML #python #удалённо #гибрид #офис
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- NLP
- Machine Learning
- LLM
- Reinforcement Learning
- RLHF
- MOE
Возможные вопросы на собеседовании
Проверка понимания специфики обучения моделей рассуждению.
Какие основные сложности возникают при масштабировании RLVR для задач с длинными цепочками рассуждений?
Оценка опыта работы с современными методами алаймента.
Как бы вы подошли к созданию единой reward-модели, которая должна оценивать как математическую точность, так и креативность текста?
Проверка технических знаний архитектур.
В чем заключаются основные проблемы стабилизации обучения MoE-архитектур при использовании RL?
Оценка навыков улучшения логики моделей.
Какие методы верификации промежуточных шагов рассуждения (process-based reward models) вы считаете наиболее эффективными?
Проверка практического опыта с NLP.
Расскажите о вашем опыте работы с дистилляцией моделей: как сохранить reasoning-способности при уменьшении параметров?
Похожие вакансии
Архитектор мультиагентных систем на базе LLM
Аналитик AI-агентов Senior
Аналитик AI-агентов
Senior Analyst AI-агентов
Middle/Senior AI-разработчик
Python-разработчик (AI)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!