yandex
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorУдалённоПолная занятость

Senior Data Scientist (NLP|LLM)

ИИОценка ИИ

Отличная вакансия для Senior-специалиста: работа с передовым стеком (LLM, агенты), социально значимый домен (медицина) и сильный соцпакет от Сбера.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Высокая сложность обусловлена требованиями к глубокой экспертизе в LLM (DPO, RLHF, LangGraph) и специфическим опытом в медицинской сфере (ICD-10, клинреки).

Анализ зарплаты

Медиана450 000 ₽
Рынок350 000 ₽ – 600 000 ₽
ИИОценка ИИ

Зарплата в объявлении не указана, но для позиции Senior Data Scientist в Москве с фокусом на LLM рыночные вилки начинаются от 350 000 рублей. С учетом специфики Сбера и сложности задач, можно ожидать предложение в верхнем диапазоне рынка.

Сопроводительное письмо

I am writing to express my strong interest in the Senior Data Scientist (NLP/LLM) position at СберЗдоровье. With over 3 years of experience in NLP and a deep focus on the full lifecycle of Large Language Models—from sophisticated data curation and SFT to advanced alignment techniques like DPO and ORPO—I am confident in my ability to contribute to your medical LLM initiatives. My background includes building complex RAG pipelines, multi-agent workflows using LangGraph, and implementing rigorous evaluation frameworks, which aligns perfectly with your requirements for developing clinical-grade AI solutions.

What excites me most about this role is the opportunity to apply state-of-the-art LLM techniques to the healthcare domain. I have practical experience with the HuggingFace ecosystem, PyTorch, and production-level inference optimization using vLLM. Furthermore, my familiarity with medical data, ICD-10, and clinical guidelines ensures that I can navigate the domain-specific risks and validation requirements essential for СберЗдоровье. I am eager to bring my expertise in building reproducible experiments and production-ready AI agents to your team.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в СберЗдоровье уже сейчас

Присоединяйтесь к команде СберЗдоровья и создавайте будущее цифровой медицины с помощью передовых LLM-технологий!

Описание вакансии

Senior Data Scientist (NLP|LLM)

Локация: Удаленно в РФ

Компания: СберЗдоровье - Платформа Digital Health

ЗП: обсуждается на собеседовании

Занятость: Полная

Обязанности:

Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning).

Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias.

Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails.

Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge там, где уместно, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде.

Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.

Требования:

3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код.

Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов.

Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения.

Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна.

Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией.

Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков.

Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation. Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка.

Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманноеchunking, grounding.

Мы предлагаем:

Удаленку из России, гибрид или офис (уютный офис в БЦ Симонов Плаза с видом на Москва-реку);

Свободный дресс-код и общение на «ты»;

ДМС после прохождения испытательного срока;

Оплачиваемые курсы английского языка в нашем офисе;

Бесплатные занятия спортом: йога, сайкл, футбол/волейбол;

Свою библиотеку бумажных книг, которая пополняется по запросу;

Компенсацию спортивного абонемента.

💬 Резюме отправлять: Откликнуться

–––

Бесплатный постинг вакансий: @freeIT_job

Забирай 📚 Базу Знаний

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • PyTorch
  • LLM
  • Kubernetes
  • PostgreSQL
  • RAG
  • NLP
  • Docker
  • MLflow
  • ElasticSearch
  • FAISS
  • LangGraph
  • RLHF
  • Hugging Face
  • vLLM
  • DeepSpeed
  • ClearML

Возможные вопросы на собеседовании

Проверка практического опыта в специфических методах дообучения, указанных в вакансии.

Расскажите о вашем опыте применения DPO или ORPO: с какими сложностями в подготовке preference-датасетов вы сталкивались?

Вакансия предполагает работу с медицинскими данными, где точность критична.

Как вы боретесь с галлюцинациями LLM в задачах RAG, особенно когда речь идет о клинических рекомендациях?

Оценка качества — ключевой блок обязанностей.

Как вы проектируете систему LLM-as-a-judge для оценки медицинских ответов, чтобы она коррелировала с экспертной оценкой врачей?

Проверка навыков построения сложных систем.

В каких случаях вы бы предпочли использование LangGraph вместо линейного RAG-пайплайна для медицинского ассистента?

Проверка навыков оптимизации для продакшна.

Какие техники оптимизации инференса в vLLM вы использовали для снижения latency при работе с длинными контекстами?

Похожие вакансии

NDA
2 000 ₽ – 2 500 ₽

ML разработчик (Senior)

SeniorУдалённо
n8n · Generative AI · Python · JavaScript · TypeScript · React · LangChain · PostgreSQL · REST · GraphQL · FastAPI · RAG · Vector Database · Prompt Engineering
+14 навыков
КС
КВИКЛИ СЕЧ ИТ
300 000 ₽ – 450 000 ₽

Senior / Middle+ Data Scientist

SeniorУдалённо
Python · Apache Spark · Machine Learning · Recommendation Systems · Ranking · NLP · LLM · MLOps · A/B Testing · Uplift Modeling
+10 навыков
S
Selecty
220 000 ₽ – 310 000 ₽

MlOps / Python Backend Engineer (ML)

SeniorУдалённо
Python · FastAPI · Flask · Kafka · Docker · Kubernetes · Airflow · Spark · Hive · SQL · MLOps · NLP · Computer Vision
+13 навыков
NDA
от 2 000 ₽

Data Scientist Senior

SeniorУдалённо
Python · Pandas · NumPy · Matplotlib · Seaborn · Plotly · Scikit-learn · SciPy · statsmodels · CatBoost · XGBoost · LightGBM · ARIMA · Prophet · Deep Learning · CNN · RNN · LSTM · Attention · Feature Engineering · tsfresh · EDA
+22 навыков
З
Зонтик
до 390 000 ₽

Senior/Middle Data Engineer

SeniorУдалённо
SQL · Python · C++ · ETL · BI · REST API · JSON · XML · Message Broker · OOP
+10 навыков
C
Centicore
340 000 ₽ – 360 000 ₽

Senior Data Scientist

SeniorУдалённо
Python · Machine Learning · Uplift Modeling · LightGBM · XGBoost · CatBoost · Scikit-learn · Pandas · NumPy · SQL · Apache Spark · Hadoop · Apache Hive · MLOps
+14 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Страна
Россия