- Страна
- Россия
Откликайтесь
на вакансии с ИИ

Senior Data Scientist (NLP/LLM)
Циан — это сильный бренд с огромными объемами данных и современным стеком. Позиция предлагает работу над амбициозными задачами в области LLM и NLP, что сейчас является самым востребованным направлением на рынке.
Сложность вакансии
Высокая сложность обусловлена требованиями к образованию в топовых вузах (МФТИ, МГУ, ВШЭ) и глубокой экспертизе в NLP/LLM. Кандидат должен не только обучать модели, но и писать код для высоконагруженных сервисов, а также владеть стеком Big Data.
Анализ зарплаты
Зарплата в объявлении не указана, но для позиции Senior Data Scientist в крупных российских тех-компаниях (Tier-1) рыночный диапазон составляет 350 000 – 550 000 рублей после вычетов. Учитывая требования к образованию и стеку, предложение должно соответствовать верхней границе рынка.
Сопроводительное письмо
I am writing to express my strong interest in the Senior Data Scientist (NLP/LLM) position at Cian. With extensive experience in Python and deep learning frameworks like PyTorch and Transformers, I have a proven track record of developing and deploying complex NLP solutions. My background includes working with the Hadoop ecosystem (PySpark, Hive) and orchestrating pipelines with Airflow, which aligns perfectly with your technical stack.
In my previous roles, I have focused on both prompt engineering for LLMs and fine-tuning custom models to solve specific business challenges. I am particularly excited about Cian's goal to automate human-like communication through AI mechanics. My strong foundation in classical ML and basic CV, combined with an MLOps mindset, allows me to build scalable and maintainable production services. I am confident that my technical expertise and ability to communicate with stakeholders will make me a valuable asset to your team.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Циан уже сейчас
Присоединяйтесь к команде Циан и создавайте передовые AI-сервисы для миллионов пользователей!
Описание вакансии
Senior Data Scientist (NLP/LLM)
#удаленка #senior
Компания: Циан
🔹Стек:
Пишем преимущественно на Python (Transformers, PyTorch, Numpy, Pandas, Sklearn, CatBoost).
Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер
Для автоматизации запусков наших пайплайнов используем Airflow
Для технических метрик — Grafana, для бизнес-метрик — FineBI.
🔹Основные задачи:
-NLP задачи как в виде обучения моделей, так и в виде разработки вспомогательных сущностей на python.
-Решение задач машинного обучения и написания кода для нагруженных сервисов на Python.
-Развитие текстовой строки новых AI механик на Циан. -Одна из целей команды - под ключ закрыть потребность общаться с человеком.
-Промпт тюнинг LLM с использованием API и внутренних сетей и fine tuning своих LLM
🔹Требования к кандидату:
-Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др.
-Python: пишет легко читаемый и поддерживаемый код
SQL запросы на продвинутом уровне — оконные функции, оптимизация запросов
-Знаком с Apache стек: HDFS/Kafka/Spark (DF API)
-Опыт разработки NLP моделей: от tfidf до llm ( работа с pytorch, transformers)
-Опыт в DL: обучение/дообучение собственных глубоких нейросетей
-Классический ML: бустинги, линейные модели.
Имеет базовые знания CV: классификация, детекция, сегментация.
-Понимает ценность MLOps, и ценность переиспользования уже готовых решений внутри компании.
-Имеет кругозор или непосредственный опыт в реализации проектов для C и B пользователей.
-Способен самостоятельно коммуницировать с заказчиками и смежниками.
Контакты: Откликнуться
🔥 Подписаться на наши каналы / @best_itjob / @it_rab
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- NumPy
- Pandas
- PyTorch
- LLM
- SQL
- Grafana
- Computer Vision
- Transformers
- MLOps
- NLP
- Scikit-learn
- PySpark
- Apache Airflow
- Apache Kafka
- CatBoost
- Apache Hive
- Apache Hadoop
Возможные вопросы на собеседовании
Проверка глубины понимания современных языковых моделей и практического опыта их адаптации.
Расскажите о вашем опыте fine-tuning LLM: какие техники (например, LoRA, QLoRA) вы использовали и с какими проблемами сталкивались?
Вакансия предполагает работу с высоконагруженными сервисами.
Как вы оптимизируете инференс тяжелых NLP моделей для работы в продакшене с низким latency?
В стеке указан Spark и Hadoop, что важно для обработки больших данных в Циан.
В каких случаях вы предпочтете использовать PySpark вместо Pandas для подготовки признаков, и как вы оптимизируете Spark-джобы?
Проверка навыков промпт-инжиниринга, упомянутых в задачах.
Какие стратегии промпт-тюнинга вы считаете наиболее эффективными для минимизации галлюцинаций модели в задачах общения с пользователем?
Оценка умения доводить ML-решение до конца и понимания жизненного цикла модели.
Опишите ваш идеальный MLOps пайплайн: от сбора данных и экспериментов до мониторинга модели в Grafana.
Похожие вакансии
MLOps Engineer
Инженер Mlops (Senior)
Senior MLOps Engineer (Platform Development / LLMOps)
Senior Data Engineer
Data Scientist Senior (Part-time)
Senior Data инженер
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Россия