yandex
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorУдалённоПолная занятость

Senior Data Scientist (NLP|LLM)

Оценка ИИ

Отличная вакансия для Senior-специалиста: работа с передовым стеком (LLM, агенты), социально значимый домен (медицина) и сильный соцпакет от Сбера.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Высокая сложность обусловлена требованиями к глубокой экспертизе в LLM (DPO, RLHF, LangGraph) и специфическим опытом в медицинской сфере (ICD-10, клинреки).

Анализ зарплаты

Медиана450 000 ₽
Рынок350 000 ₽ – 600 000 ₽
Оценка ИИ

Зарплата в объявлении не указана, но для позиции Senior Data Scientist в Москве с фокусом на LLM рыночные вилки начинаются от 350 000 рублей. С учетом специфики Сбера и сложности задач, можно ожидать предложение в верхнем диапазоне рынка.

Сопроводительное письмо

I am writing to express my strong interest in the Senior Data Scientist (NLP/LLM) position at СберЗдоровье. With over 3 years of experience in NLP and a deep focus on the full lifecycle of Large Language Models—from sophisticated data curation and SFT to advanced alignment techniques like DPO and ORPO—I am confident in my ability to contribute to your medical LLM initiatives. My background includes building complex RAG pipelines, multi-agent workflows using LangGraph, and implementing rigorous evaluation frameworks, which aligns perfectly with your requirements for developing clinical-grade AI solutions.

What excites me most about this role is the opportunity to apply state-of-the-art LLM techniques to the healthcare domain. I have practical experience with the HuggingFace ecosystem, PyTorch, and production-level inference optimization using vLLM. Furthermore, my familiarity with medical data, ICD-10, and clinical guidelines ensures that I can navigate the domain-specific risks and validation requirements essential for СберЗдоровье. I am eager to bring my expertise in building reproducible experiments and production-ready AI agents to your team.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в СберЗдоровье уже сейчас

Присоединяйтесь к команде СберЗдоровья и создавайте будущее цифровой медицины с помощью передовых LLM-технологий!

Описание вакансии

Senior Data Scientist (NLP|LLM)

Локация: Удаленно в РФ

Компания: СберЗдоровье - Платформа Digital Health

ЗП: обсуждается на собеседовании

Занятость: Полная

Обязанности:

Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning).

Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias.

Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails.

Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge там, где уместно, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде.

Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.

Требования:

3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код.

Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов.

Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения.

Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна.

Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией.

Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков.

Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation. Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка.

Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманноеchunking, grounding.

Мы предлагаем:

Удаленку из России, гибрид или офис (уютный офис в БЦ Симонов Плаза с видом на Москва-реку);

Свободный дресс-код и общение на «ты»;

ДМС после прохождения испытательного срока;

Оплачиваемые курсы английского языка в нашем офисе;

Бесплатные занятия спортом: йога, сайкл, футбол/волейбол;

Свою библиотеку бумажных книг, которая пополняется по запросу;

Компенсацию спортивного абонемента.

💬 Резюме отправлять: Откликнуться

–––

Бесплатный постинг вакансий: @freeIT_job

Забирай 📚 Базу Знаний

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • PyTorch
  • LLM
  • Kubernetes
  • PostgreSQL
  • RAG
  • NLP
  • Docker
  • MLflow
  • ElasticSearch
  • FAISS
  • LangGraph
  • RLHF
  • Hugging Face
  • vLLM
  • DeepSpeed
  • ClearML

Возможные вопросы на собеседовании

Проверка практического опыта в специфических методах дообучения, указанных в вакансии.

Расскажите о вашем опыте применения DPO или ORPO: с какими сложностями в подготовке preference-датасетов вы сталкивались?

Вакансия предполагает работу с медицинскими данными, где точность критична.

Как вы боретесь с галлюцинациями LLM в задачах RAG, особенно когда речь идет о клинических рекомендациях?

Оценка качества — ключевой блок обязанностей.

Как вы проектируете систему LLM-as-a-judge для оценки медицинских ответов, чтобы она коррелировала с экспертной оценкой врачей?

Проверка навыков построения сложных систем.

В каких случаях вы бы предпочли использование LangGraph вместо линейного RAG-пайплайна для медицинского ассистента?

Проверка навыков оптимизации для продакшна.

Какие техники оптимизации инференса в vLLM вы использовали для снижения latency при работе с длинными контекстами?

Похожие вакансии

NDA
173 416 ₽ – 306 000 ₽

Инженер Mlops (Senior)

SeniorУдалённоРоссия
MLOps · Kubernetes · Docker · Helm · Jenkins · GitLab CI · Python · Airflow · JupyterHub · MLflow · Seldon · CUDA · Hadoop · Apache Spark · Apache Kafka · ELK stack · RAG · LLMOps · AutoML · Computer Vision
+20 навыков
V
Volna.tech
386 000 ₽ – 436 000 ₽

Senior MLOps Engineer (Platform Development / LLMOps)

SeniorУдалённоРоссия
Docker · Helm · Jenkins · GitLab CI · Python · Airflow · JupyterHub · MLflow · Seldon · CUDA · Kubernetes · Hadoop · Spark · Kafka · ELK · LLMOps · RAG
+17 навыков
Y
YCLIENTS
до 450 000 ₽

Senior Data Engineer

SeniorУдалённоРоссия
SQL · Python · Apache Airflow · ClickHouse · Apache Iceberg · S3 · Debezium · Apache Kafka · Trino · CDC · ETL
+11 навыков
S
Strikt
до 300 000 ₽

Data Scientist Senior (Part-time)

SeniorУдалённоРоссия
Python · Machine Learning · Time Series Analysis · SQL · Pandas · NumPy · Matplotlib · Scikit-learn · Jupyter Notebook · Clustering · K-Means · DBSCAN
+12 навыков
OS
Omega Solutions
2 000 ₽ – 2 700 ₽

Senior Data инженер

SeniorУдалённоРоссия
Java · Groovy · Hadoop · ETL · DWH · SQL · Docker · Apache NiFi · Airflow · SAP HANA · Apache Kafka · Apache Iceberg · Python · Go · Linux · Ansible · Zabbix · HDFS · Hive
+19 навыков
C
Centicore
340 000 ₽ – 380 000 ₽

Senior MLOps

SeniorУдалённоРоссия
Docker · Helm · Jenkins · GitLab CI · Python · Airflow · JupyterHub · MLflow · Seldon Core · CUDA · Kubernetes · Hadoop · Apache Spark · Apache Kafka · ELK stack
+15 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Страна
Россия