Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

SeniorУдалённоПолная занятость

Senior Data Scientist (NLP|LLM)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Отличная вакансия для Senior-специалиста: работа с передовым стеком (LLM, агенты), социально значимый домен (медицина) и сильный соцпакет от Сбера.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена требованиями к глубокой экспертизе в LLM (DPO, RLHF, LangGraph) и специфическим опытом в медицинской сфере (ICD-10, клинреки).

Анализ зарплаты

Медиана450 000 ₽

Рынок350 000 ₽ – 600 000 ₽

Зарплата в объявлении не указана, но для позиции Senior Data Scientist в Москве с фокусом на LLM рыночные вилки начинаются от 350 000 рублей. С учетом специфики Сбера и сложности задач, можно ожидать предложение в верхнем диапазоне рынка.

I am writing to express my strong interest in the Senior Data Scientist (NLP/LLM) position at СберЗдоровье. With over 3 years of experience in NLP and a deep focus on the full lifecycle of Large Language Models—from sophisticated data curation and SFT to advanced alignment techniques like DPO and ORPO—I am confident in my ability to contribute to your medical LLM initiatives. My background includes building complex RAG pipelines, multi-agent workflows using LangGraph, and implementing rigorous evaluation frameworks, which aligns perfectly with your requirements for developing clinical-grade AI solutions.

What excites me most about this role is the opportunity to apply state-of-the-art LLM techniques to the healthcare domain. I have practical experience with the HuggingFace ecosystem, PyTorch, and production-level inference optimization using vLLM. Furthermore, my familiarity with medical data, ICD-10, and clinical guidelines ensures that I can navigate the domain-specific risks and validation requirements essential for СберЗдоровье. I am eager to bring my expertise in building reproducible experiments and production-ready AI agents to your team.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в СберЗдоровье уже сейчас

Присоединяйтесь к команде СберЗдоровья и создавайте будущее цифровой медицины с помощью передовых LLM-технологий!

Описание вакансии

Senior Data Scientist (NLP|LLM)

Локация: Удаленно в РФ

Компания: СберЗдоровье - Платформа Digital Health

ЗП: обсуждается на собеседовании

Занятость: Полная

Обязанности:

Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning).

Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias.

Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails.

Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge там, где уместно, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде.

Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.

Требования:

3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код.

Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов.

Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения.

Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна.

Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией.

Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков.

Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation. Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка.

Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманноеchunking, grounding.

Мы предлагаем:

Удаленку из России, гибрид или офис (уютный офис в БЦ Симонов Плаза с видом на Москва-реку);

Свободный дресс-код и общение на «ты»;

ДМС после прохождения испытательного срока;

Оплачиваемые курсы английского языка в нашем офисе;

Бесплатные занятия спортом: йога, сайкл, футбол/волейбол;

Свою библиотеку бумажных книг, которая пополняется по запросу;

Компенсацию спортивного абонемента.

💬 Резюме отправлять: Откликнуться

–––

Бесплатный постинг вакансий: @freeIT_job

Забирай 📚 Базу Знаний

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
NLP
LLM
PyTorch
Hugging Face
DeepSpeed
MLflow
ClearML
RAG
LangGraph
Docker
Kubernetes
FAISS
ElasticSearch
PostgreSQL
vLLM
RLHF

Возможные вопросы на собеседовании

Проверка практического опыта в специфических методах дообучения, указанных в вакансии.

Расскажите о вашем опыте применения DPO или ORPO: с какими сложностями в подготовке preference-датасетов вы сталкивались?

Вакансия предполагает работу с медицинскими данными, где точность критична.

Как вы боретесь с галлюцинациями LLM в задачах RAG, особенно когда речь идет о клинических рекомендациях?

Оценка качества — ключевой блок обязанностей.

Как вы проектируете систему LLM-as-a-judge для оценки медицинских ответов, чтобы она коррелировала с экспертной оценкой врачей?

Проверка навыков построения сложных систем.

В каких случаях вы бы предпочли использование LangGraph вместо линейного RAG-пайплайна для медицинского ассистента?

Проверка навыков оптимизации для продакшна.

Какие техники оптимизации инференса в vLLM вы использовали для снижения latency при работе с длинными контекстами?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия