- Страна
- Россия
Откликайтесь
на вакансии с ИИ

Senior Data Scientist (NLP|LLM)
Отличная вакансия для Senior-специалиста: работа с передовым стеком (LLM, агенты), социально значимый домен (медицина) и сильный соцпакет от Сбера.
Сложность вакансии
Высокая сложность обусловлена требованиями к глубокой экспертизе в LLM (DPO, RLHF, LangGraph) и специфическим опытом в медицинской сфере (ICD-10, клинреки).
Анализ зарплаты
Зарплата в объявлении не указана, но для позиции Senior Data Scientist в Москве с фокусом на LLM рыночные вилки начинаются от 350 000 рублей. С учетом специфики Сбера и сложности задач, можно ожидать предложение в верхнем диапазоне рынка.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в СберЗдоровье уже сейчас
Присоединяйтесь к команде СберЗдоровья и создавайте будущее цифровой медицины с помощью передовых LLM-технологий!
Описание вакансии
Senior Data Scientist (NLP|LLM)
Локация: Удаленно в РФ
Компания: СберЗдоровье - Платформа Digital Health
ЗП: обсуждается на собеседовании
Занятость: Полная
Обязанности:
Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning).
Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias.
Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails.
Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge там, где уместно, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде.
Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.
Требования:
3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код.
Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов.
Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения.
Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна.
Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией.
Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков.
Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation. Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка.
Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманноеchunking, grounding.
Мы предлагаем:
Удаленку из России, гибрид или офис (уютный офис в БЦ Симонов Плаза с видом на Москва-реку);
Свободный дресс-код и общение на «ты»;
ДМС после прохождения испытательного срока;
Оплачиваемые курсы английского языка в нашем офисе;
Бесплатные занятия спортом: йога, сайкл, футбол/волейбол;
Свою библиотеку бумажных книг, которая пополняется по запросу;
Компенсацию спортивного абонемента.
💬 Резюме отправлять: Откликнуться
–––
Бесплатный постинг вакансий: @freeIT_job
Забирай 📚 Базу Знаний
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- PyTorch
- LLM
- Kubernetes
- PostgreSQL
- RAG
- NLP
- Docker
- MLflow
- ElasticSearch
- FAISS
- LangGraph
- RLHF
- Hugging Face
- vLLM
- DeepSpeed
- ClearML
Возможные вопросы на собеседовании
Проверка практического опыта в специфических методах дообучения, указанных в вакансии.
Расскажите о вашем опыте применения DPO или ORPO: с какими сложностями в подготовке preference-датасетов вы сталкивались?
Вакансия предполагает работу с медицинскими данными, где точность критична.
Как вы боретесь с галлюцинациями LLM в задачах RAG, особенно когда речь идет о клинических рекомендациях?
Оценка качества — ключевой блок обязанностей.
Как вы проектируете систему LLM-as-a-judge для оценки медицинских ответов, чтобы она коррелировала с экспертной оценкой врачей?
Проверка навыков построения сложных систем.
В каких случаях вы бы предпочли использование LangGraph вместо линейного RAG-пайплайна для медицинского ассистента?
Проверка навыков оптимизации для продакшна.
Какие техники оптимизации инференса в vLLM вы использовали для снижения latency при работе с длинными контекстами?
Похожие вакансии
ML разработчик (Senior)
Senior / Middle+ Data Scientist
MlOps / Python Backend Engineer (ML)
Data Scientist Senior
Senior/Middle Data Engineer
Senior Data Scientist
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Россия