- Страна
- Россия
- Зарплата
- 1 900 ₽ – 2 000 ₽
Откликайтесь
на вакансии с ИИ

Data Scientist Middle+, Senior
Длительный проект до конца 2026 года обеспечивает стабильность. Четко прописанные задачи и стек технологий делают вакансию привлекательной для опытных специалистов.
Сложность вакансии
Требуется серьезный опыт работы с Big Data стеком (PySpark) и специфическая экспертиза в прогнозировании временных рядов для ритейла. Двухчасовое техническое интервью подтверждает высокий порог входа.
Анализ зарплаты
Ставка 1900-2000 (вероятно, в час или за смену, в зависимости от условий договора) соответствует рыночному уровню для Middle+/Senior специалистов в РФ при работе через ИП/Самозанятость. Годовая или месячная сумма будет конкурентной для сектора ритейл-аналитики.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Присоединяйтесь к масштабному проекту в ритейле и развивайте системы прогнозирования спроса на базе PySpark!
Описание вакансии
Data Scientist Middle+, Senior
Ставка: 1900 - 2000, с НДС
Локация: РФ, РБ
Длительность проекта: до 31.12.2026
Обязательные требования
- Опыт в Data Science / Machine Learning от 2,5 лет;
- Умение четко оценивать сроки и реалистично подходить к постановке задач;
- Прагматизм: готовность искать рабочие решения, а не идеальные, но нереализуемые модели. • Ответственность: завершать проекты, а не бросать их на полпути;
- Глубокое знание Python, SQL и PySpark. Разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись). Оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными);
- Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch);
- Опыт работы с данными: обработка, анализ, feature engineering;
- Общительность и неконфликтность – умение работать в команде и эффективно коммуницировать с коллегами.
Дополнительные требования
- Опыт продакшн-разработки (не только исследования);
- Понимание, как устроены процессы в бизнесе, а не только в Jupyter Notebook;
- Умение запускать ML-модели в PySpark: использование Spark MLlib для распределенного обучения, работа с PySpark Pandas UDFs для эффективного применения ML-моделей к большим данным.
Задачи на проекте
- Поддерживать и развивать модели прогнозирования спроса. На данный момент их две: краткосрочная, для того чтобы снабжать магазины, а так же долгосрочная - для пополнения РЦ (с которых пополняются магазины);
- Примерно 70% времени занимает практическая ML-разработка: написание кода, проведение исследования и эксперименты;
- Остальные 30% времени уйдут на общение, подготовку презентаций и работу с требованиями.
Этапы отбора:
- Интервью с рекрутером
- Техническое интервью (2 ч)
- Менеджерский этап (1 ч).
Описание проекта и команды
Заказчик - крупный ритейлер.
Проект связан с прогнозированием спроса для пополнения магазинов и складов (временные ряды).
Откликнуться на запрос: Откликнуться По вопросам партнерского сотрудничества: Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- SQL
- PySpark
- ETL
- Scikit-learn
- TensorFlow
- PyTorch
- Machine Learning
- Data Science
- Feature Engineering
- Spark MLlib
- Pandas
Возможные вопросы на собеседовании
Вакансия делает упор на оптимизацию Spark-запросов.
Расскажите о вашем опыте оптимизации PySpark приложений: в каких случаях вы используете broadcast-переменные и как боретесь с проблемой data skew?
Проект связан с прогнозированием спроса (временные ряды).
Какие методы валидации временных рядов вы используете, чтобы избежать заглядывания в будущее (data leakage)?
Упоминается использование Spark MLlib и Pandas UDFs.
В чем преимущество использования Pandas UDFs по сравнению с обычными Python UDFs в PySpark при применении ML-моделей?
В требованиях указан прагматизм и бизнес-ориентированность.
Приведите пример, когда вам приходилось выбирать более простую модель вместо сложной ради стабильности в продакшене или скорости внедрения.
Работа включает поддержку моделей пополнения РЦ и магазинов.
Как вы оцениваете точность моделей прогнозирования спроса и какие бизнес-метрики (например, WAPE, BIAS) приоритетны для ритейла?
Похожие вакансии
Python разработчик (DWH/Data Engineering)
Data Scientist
Middle+ Data инженер
Senior ML/LLM Инженер
Senior Data Engineer
Senior Data Engineer
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!