- Страна
- Россия
- Зарплата
- 270 000 ₽ – 330 000 ₽
Откликайтесь
на вакансии с ИИ

Data Scientist
Стабильная компания, четко описанные задачи и стек технологий. Зарплатная вилка соответствует рыночному уровню для Middle+/Senior специалистов в РФ, а удаленный формат работы является значительным плюсом.
Сложность вакансии
Позиция требует серьезного опыта работы с Big Data стеком (PySpark, Spark MLlib) и глубокого понимания специфики временных рядов в ритейле. Сочетание исследовательской деятельности и продакшн-разработки повышает планку требований к кандидату.
Анализ зарплаты
Предложенная вилка 270 000 – 330 000 руб. на руки полностью соответствует текущим рыночным реалиям для специалистов уровня Middle+/Senior в области Data Science с навыками работы в Big Data. Верхняя граница может быть чуть ниже рыночного максимума для топовых Senior-позиций, но остается конкурентоспособной.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в JETLYN уже сейчас
Отправьте свое резюме @Geniya_HR и станьте частью команды, создающей передовые ML-решения для крупного ритейла!
Описание вакансии
#РФ #вакансия #remote #удаленно #DataScientist #ML
Вакансия: Data Scientist
Грейд: Middle+/Senior
Компания: JETLYN
Формат: удаленно
Локация: РФ
Гражданство: РФ
Вилка ЗП: от 270 000 до 330 000 рублей на руки в месяц
Условия оформления, формат: ТК/ИП
🟡О проекте: крупный ритейл. Проект связан с прогнозированием спроса для пополнения магазинов и складов (временные ряды).
🟡Задачи на проекте:
- Поддерживать и развивать модели прогнозирования спроса. На данный момент их две: краткосрочная, для того чтобы снабжать магазины, а так же долгосрочная - для пополнения РЦ (с которых пополняются магазины);
- Примерно 70% времени занимает практическая ML-разработка: написание кода, проведение исследования и эксперименты;
- Остальные 30% времени уйдут на общение, подготовку презентаций и работу с требованиями.
🟡Обязательные требования:
- Опыт в Data Science / Machine Learning от 2,5 лет;
- Умение четко оценивать сроки и реалистично подходить к постановке задач;
- Прагматизм: готовность искать рабочие решения, а не идеальные, но нереализуемые модели. • Ответственность: завершать проекты, а не бросать их на полпути;
- Глубокое знание Python, SQL и PySpark. Разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись). Оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными);
- Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch);
- Опыт работы с данными: обработка, анализ, feature engineering;
- Общительность и неконфликтность – умение работать в команде и эффективно коммуницировать с коллегами.
🟡Дополнительные требования:
- Опыт продакшн-разработки (не только исследования);
- Понимание, как устроены процессы в бизнесе, а не только в Jupyter Notebook;
- Умение запускать ML-модели в PySpark: использование Spark MLlib для распределенного обучения, работа с PySpark Pandas UDFs для эффективного применения ML-моделей к большим данным.
Резюме и вопросы направляйте, пожалуйста, в телеграмм в ЛС Откликнуться 💻
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- SQL
- PySpark
- ETL
- Scikit-learn
- TensorFlow
- PyTorch
- Spark MLlib
- Feature Engineering
- Machine Learning
- Time Series
Возможные вопросы на собеседовании
Проект напрямую связан с прогнозированием спроса, где временные ряды являются ключевым объектом исследования.
Какие методы обработки пропусков и аномалий в данных временных рядов вы считаете наиболее эффективными для задач ритейла?
В требованиях указана оптимизация Spark-запросов и работа с большими данными.
Расскажите о вашем опыте оптимизации PySpark приложений. В каких случаях вы используете broadcast-переменные и как боретесь с перекосом данных (data skew)?
Вакансия предполагает работу с долгосрочными и краткосрочными прогнозами.
В чем принципиальное различие в подходах к моделированию краткосрочного спроса для магазинов и долгосрочного для распределительных центров?
Компания ищет прагматичного разработчика, ориентированного на бизнес-результат.
Опишите ситуацию, когда вам пришлось пожертвовать точностью модели ради скорости её работы или простоты внедрения в продакшн.
Упоминается использование Spark MLlib и Pandas UDFs.
В каких сценариях использование Pandas UDFs в PySpark предпочтительнее стандартных трансформаций, и какие ограничения это накладывает на память?
Похожие вакансии
Python разработчик (DWH/Data Engineering)
Data Scientist Middle+, Senior
Middle+ Data инженер
Senior ML/LLM Инженер
Senior Data Engineer
Senior Data Engineer
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!