- Страна
- Россия
Откликайтесь
на вакансии с ИИ

Data Science / Machine Learning Engineer
Хорошая вакансия для специалистов среднего уровня (Middle) с акцентом на Big Data. Четкое разделение рабочего времени и понятный стек технологий делают предложение привлекательным, несмотря на отсутствие названия компании.
Сложность вакансии
Позиция требует уверенного владения стеком Big Data (PySpark, SQL) и опыта в ML от 2 лет. Основная сложность заключается в необходимости сочетать технические навыки с бизнес-ориентированным подходом и умением оптимизировать распределенные вычисления.
Анализ зарплаты
В объявлении не указана заработная плата, однако для специалистов уровня Middle Data Scientist с навыками PySpark в РФ рыночный диапазон составляет от 200 000 до 350 000 рублей. Данная роль предполагает работу с большими данными, что обычно оплачивается выше среднего по рынку ML.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Если вы готовы создавать прагматичные ML-решения и работать с большими данными на PySpark, откликайтесь прямо сейчас!
Описание вакансии
Data Science / Machine Learning
Компания: NDA.
Локация: РФ.
Задачи:
Примерно 70% времени вы будете заниматься практической ML-разработкой: писать код, проводить исследования и эксперименты. Остальные 30% времени уйдут на общение, подготовку презентаций и работу с требованиями.
ТРЕБОВАНИЯ
Основные требования
•Опыт в Data Science / Machine Learning от 2 лет.
• Умение четко оценивать сроки и реалистично подходить к постановке задач.
• Прагматизм: готовность искать рабочие решения, а не идеальные, но нереализуемые модели.
• Ответственность: завершать проекты, а не бросать их на полпути.
• Глубокое знание Python, SQL и PySpark:
◦ Разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись).
◦ Оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными).
• Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch).
• Опыт работы с данными: обработка, анализ, feature engineering.
• Общительность и неконфликтность – умение работать в команде и эффективно коммуницировать с коллегами.
Плюсом будет:
• Опыт продакшн-разработки (не только исследования).
• Понимание, как устроены процессы в бизнесе, а не только в Jupyter Notebook.
• Умение запускать ML-модели в PySpark:
◦ Использование Spark MLlib для распределенного обучения.
◦ Работа с PySpark Pandas UDFs для эффективного применения ML-моделей к большим данным.
СТЕК ТЕХНОЛОГИЙ
Data ScienceMachine LearningPythonSQLPySparkScikit-learnTensorFlowPyTorchSpark MLlibPySpark Pandas UDFs
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- SQL
- PySpark
- Scikit-learn
- TensorFlow
- PyTorch
- Spark MLlib
- ETL
- Feature Engineering
- Big Data
- Pandas
Возможные вопросы на собеседовании
Вакансия делает упор на оптимизацию Spark-запросов. Важно понимать, как кандидат справляется с перекосом данных.
Расскажите о вашем опыте оптимизации Spark-запросов. Как вы боретесь с проблемой Data Skew?
В описании указан прагматизм как ключевое требование. Вопрос проверяет умение выбирать эффективные, а не просто сложные решения.
Приведите пример ситуации, когда вам пришлось отказаться от сложной модели в пользу более простого, но эффективного для бизнеса решения.
Требуется опыт работы с PySpark Pandas UDFs. Это специфический навык для высокопроизводительной обработки.
В каких случаях использование Pandas UDF в PySpark предпочтительнее стандартных Python UDF, и какие есть ограничения?
70% времени — разработка, 30% — коммуникации. Вопрос проверяет навыки сбора требований.
Как вы подходите к процессу сбора требований к ML-модели от бизнес-заказчиков, которые не являются техническими специалистами?
Упомянуто использование Spark MLlib. Важно знать опыт работы с распределенным обучением.
Какие основные отличия и сложности возникают при обучении моделей с использованием Spark MLlib по сравнению с классическим Scikit-learn на одной машине?
Похожие вакансии
Python разработчик (DWH/Data Engineering)
Data Scientist Middle+, Senior
Data Scientist
Middle+ Data инженер
Backend / ML Infrastructure / MLOps инженер
Junior Applied ML Engineer / Data Scientist
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!