Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

SeniorГибридПолная занятость

Старший LLM-разработчик в команду рассуждений YandexGPT

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Это топовая позиция в одной из ведущих технологических компаний России. Работа над флагманским продуктом (YandexGPT) с доступом к огромным вычислительным ресурсам и сильной командой делает эту вакансию максимально привлекательной для ML-специалиста.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует глубокой экспертизы в области LLM, RLHF и современных алгоритмов обучения. Задачи связаны с R&D на переднем крае технологий, что подразумевает высокий порог входа и необходимость владения SOTA-методами.

Анализ зарплаты

Медиана450 000 ₽

Рынок350 000 ₽ – 650 000 ₽

Зарплаты для Senior LLM-разработчиков в крупных российских тех-гигантах обычно находятся в верхнем сегменте рынка, часто превышая средние показатели за счет премий и опционов. Указанный диапазон отражает текущие рыночные реалии для специалистов такого уровня в Москве.

Меня крайне заинтересовала вакансия старшего LLM-разработчика в команду рассуждений YandexGPT. Мой опыт в области NLP и глубокое понимание архитектур современных языковых моделей позволяют мне эффективно решать задачи по улучшению reasoning-способностей. Я имею практический опыт работы с Python и реализации сложных ML-проектов, что соответствует вашим требованиям.

Особенно меня привлекает возможность работы над масштабированием RLVR- и RLHF-обучения, а также эксперименты с SOTA-подходами в RL. Я уверен, что мои навыки в исследовании reward-моделей и оптимизации Dense- и MoE-архитектур принесут значительную пользу вашим продуктам. Буду рад обсудить, как мой опыт поможет Alice AI LLM стать еще умнее и логичнее.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Яндекс уже сейчас

Присоединяйтесь к команде YandexGPT и создавайте будущее LLM-рассуждений в Яндексе!

Описание вакансии

*❣️ Старший LLM-разработчик в команду рассуждений YandexGPT*

Наша команда улучшает способности к рассуждениям семейства моделей Alice AI LLM. Мы стремимся создать единую модель, объединяющую сильные стороны рассуждений, использование внешних функций и поисковые возможности наших сервисов.

Какие задачи вас ждут:

• Развитие базовых reasoning-способностей YandexGPTБлижайшая цель — научиться эффективнее масштабировать RLVR- и RLHF-обучение reasoning-моделей для B2C‑задач широкого круга пользователей. Вас ждут эксперименты по улучшению общих свойств модели (полезность, логичность, структура) за счёт повышения качества цепочек рассуждений и усиления паттернов (backtracking, верификация) на задачах разной тематики.

• Объединение сигналов в общей моделиМы стремимся создать новые этапы алайнмента и системы наград, которые позволят совместить сигналы на математических и научных задачах вместе с креативными, повысив качество рассуждений в каждой области по сравнению с независимым обучением. Вам предстоит проводить исследования с новыми reward‑моделями, этапами и дистилляцией в рамках единой модели.

• Эксперименты с RL-алгоритмамиВы будете искать SOTA-подходы, которые приносят пользу реальному продукту: экспериментировать с RL‑алгоритмами, тестировать методы стабилизации обучения Dense‑ и MoE‑архитектур.

Мы ждём, что вы:• Отлично разбираетесь в NLP и классическом ML

• Владеете Python

• Понимаете, как устроены современные LLM, решали с их помощью прикладные задачи или имеете релевантный исследовательский опыт

Наши бонусы:Мы заботимся о детях яндексоидов и устраиваем детские дни в офисе. Это не все бонусы — полный список тут.

*📩* Откликнуться на нашем сайте

#генеративные_технологии #ML #python #удалённо #гибрид #офис

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
NLP
Machine Learning
LLM
Reinforcement Learning
RLHF
MOE

Возможные вопросы на собеседовании

Проверка понимания специфики обучения моделей рассуждению.

Какие основные сложности возникают при масштабировании RLVR для задач с длинными цепочками рассуждений?

Оценка опыта работы с современными методами алаймента.

Как бы вы подошли к созданию единой reward-модели, которая должна оценивать как математическую точность, так и креативность текста?

Проверка технических знаний архитектур.

В чем заключаются основные проблемы стабилизации обучения MoE-архитектур при использовании RL?

Оценка навыков улучшения логики моделей.

Какие методы верификации промежуточных шагов рассуждения (process-based reward models) вы считаете наиболее эффективными?

Проверка практического опыта с NLP.

Расскажите о вашем опыте работы с дистилляцией моделей: как сохранить reasoning-способности при уменьшении параметров?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

Старший LLM-разработчик в команду рассуждений YandexGPT

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Яндекс уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие основные сложности возникают при масштабировании RLVR для задач с длинными цепочками рассуждений?

Как бы вы подошли к созданию единой reward-модели, которая должна оценивать как математическую точность, так и креативность текста?

В чем заключаются основные проблемы стабилизации обучения MoE-архитектур при использовании RL?

Какие методы верификации промежуточных шагов рассуждения (process-based reward models) вы считаете наиболее эффективными?

Расскажите о вашем опыте работы с дистилляцией моделей: как сохранить reasoning-способности при уменьшении параметров?

Похожие вакансии

Архитектор мультиагентных систем на базе LLM

Аналитик AI-агентов Senior

Аналитик AI-агентов

Senior Analyst AI-агентов

Middle/Senior AI-разработчик

Python-разработчик (AI)

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Старший LLM-разработчик в команду рассуждений YandexGPT

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Яндекс уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие основные сложности возникают при масштабировании RLVR для задач с длинными цепочками рассуждений?

Как бы вы подошли к созданию единой reward-модели, которая должна оценивать как математическую точность, так и креативность текста?

В чем заключаются основные проблемы стабилизации обучения MoE-архитектур при использовании RL?

Какие методы верификации промежуточных шагов рассуждения (process-based reward models) вы считаете наиболее эффективными?

Расскажите о вашем опыте работы с дистилляцией моделей: как сохранить reasoning-способности при уменьшении параметров?

Похожие вакансии

Архитектор мультиагентных систем на базе LLM

Аналитик AI-агентов Senior

Аналитик AI-агентов

Senior Analyst AI-агентов

Middle/Senior AI-разработчик

Python-разработчик (AI)

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ