- Страна
- Россия
Откликайтесь
на вакансии с ИИ

ML-исследователь генеративных моделей персонализации
Это топовая позиция в одной из лучших технологических компаний России. Работа над передовыми технологиями (LLM + RecSys) на огромных масштабах данных в сочетании с отличным соцпакетом делает вакансию максимально привлекательной.
Сложность вакансии
Роль требует исключительных знаний в области Deep Learning, понимания архитектур LLM и опыта работы с Reinforcement Learning (GRPO). Высокая сложность обусловлена необходимостью совмещать научные исследования с инженерной оптимизацией для высоконагруженных систем.
Анализ зарплаты
В вакансии не указан точный уровень дохода, однако для позиций уровня Senior ML Researcher в Яндексе рыночные ожидания составляют от 450 000 до 700 000 рублей и выше, включая бонусы и опционы. Предложенные условия по бенефитам (чекапы, психотерапия) соответствуют премиальному сегменту рынка.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Яндекс уже сейчас
Присоединяйтесь к команде Яндекса, чтобы создавать будущее рекомендательных систем на стыке LLM и персонализации!
Описание вакансии
*❣️ ML-исследователь генеративных моделей персонализации*
Мы решаем задачу персонализации с помощью LLM-подобных технологий: переводим пользователей в специализированное пространство токенов и обрабатываем полученные последовательности с помощью генеративных моделей. Результаты работы нашей команды применяются во всех крупных рекомендательных системах Яндекса.
Какие задачи вас ждут:
• Оптимизировать архитектуру нейросетиМы постоянно развиваем архитектуру и рецепты обучения наших моделей, адаптируя последние индустриальные тренды. Наша задача — не только обеспечить высокое качество предсказания, но и выдерживать нагрузку, создаваемую многими миллионами пользователей Яндекса.
• Развивать алгоритмы токенизацииТокенизация в генеративных моделях персонализации — активно развивающаяся область. Она включает в себя построение семантических моделей, исследование алгоритмов квантизации, а также continuous learning.
• Исследовать Alignment с использованием RLМы строим алгоритмы, которые адаптируются под вкусы пользователей с использованием GRPO, обучаясь как на reward-модели, так и на прямом фидбэке.
• Интегрироваться в LLM в качестве новой модальностиМы исследуем не только модели генеративной персонализации, но и возможности их объединения с LLM, чтобы строить системы с уникальными свойствами: способностью следовать инструкциям и объяснять рекомендации.
Мы ждём, что вы:• Глубоко понимаете, как устроен современный DL с научной и инженерной точек зрения
• Командный игрок: готовы браться за широкий спектр задач, которые продвигают команду вперёд
• Следите за трендами в таких областях, как LLM, мультимодальность, RecSys
Почему у нас хорошо:Мы предоставляем полный набор, который поможет уберечься от тревожности и выгорания: ежегодные медицинские чекапы, йога и психотерапия. Это не все бонусы — полный список тут.
*📩* Откликнуться на нашем сайте
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Deep Learning
- LLM
- Reinforcement Learning
- RecSys
- Python
- PyTorch
- NLP
- Alignment
- Quantization
- Continuous Learning
Возможные вопросы на собеседовании
Вакансия упоминает использование GRPO для адаптации под вкусы пользователей.
Расскажите о принципе работы алгоритма GRPO и его преимуществах перед PPO в контексте Alignment моделей?
Команда работает над переводом пользователей в пространство токенов.
Какие подходы к токенизации пользовательских действий в RecSys вы считаете наиболее эффективными для последующей обработки генеративными моделями?
Упоминается необходимость выдерживать нагрузку миллионов пользователей.
Какие методы квантизации и оптимизации инференса LLM-подобных моделей вы применяли на практике для работы в real-time системах?
Задача включает интеграцию персонализации в LLM как новой модальности.
Как бы вы подошли к архитектурному решению задачи 'объяснимых рекомендаций' при интеграции RecSys-токенов в текстовую LLM?
Требуется опыт в Continuous Learning.
С какими основными проблемами (например, катастрофическое забывание) вы сталкивались при реализации Continuous Learning в продакшене и как их решали?
Похожие вакансии
Python разработчик (DWH/Data Engineering)
Data Scientist Middle+, Senior
Data Scientist
Middle+ Data инженер
Senior ML/LLM Инженер
Junior Applied ML Engineer / Data Scientist
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!