yandex
N
NDA
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
УдалённоПолная занятость

Data Science / Machine Learning Engineer

ИИОценка ИИ

Хорошая вакансия для специалистов среднего уровня (Middle) с акцентом на Big Data. Четкое разделение рабочего времени и понятный стек технологий делают предложение привлекательным, несмотря на отсутствие названия компании.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Позиция требует уверенного владения стеком Big Data (PySpark, SQL) и опыта в ML от 2 лет. Основная сложность заключается в необходимости сочетать технические навыки с бизнес-ориентированным подходом и умением оптимизировать распределенные вычисления.

Анализ зарплаты

Медиана270 000 ₽
Рынок200 000 ₽ – 350 000 ₽
ИИОценка ИИ

В объявлении не указана заработная плата, однако для специалистов уровня Middle Data Scientist с навыками PySpark в РФ рыночный диапазон составляет от 200 000 до 350 000 рублей. Данная роль предполагает работу с большими данными, что обычно оплачивается выше среднего по рынку ML.

Сопроводительное письмо

Меня заинтересовала вакансия Data Science / Machine Learning инженера, так как мой опыт и подход к разработке полностью соответствуют вашим требованиям. Я обладаю более чем двухлетним опытом в области машинного обучения и глубокими знаниями Python, SQL и PySpark. В своей работе я придерживаюсь принципа прагматизма, фокусируясь на создании работающих бизнес-решений и эффективной оптимизации Spark-запросов для обработки больших данных.

Особенно меня привлекла возможность совмещать глубокую техническую разработку (70% времени) с коммуникацией и работой над требованиями. Я имею опыт построения ETL-процессов и внедрения моделей в продакшн, что позволяет мне не просто проводить исследования в Jupyter Notebook, но и доводить проекты до логического завершения. Буду рад обсудить, как мой опыт в ML и навыки работы с PySpark помогут вашей команде в решении текущих задач.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Если вы готовы создавать прагматичные ML-решения и работать с большими данными на PySpark, откликайтесь прямо сейчас!

Описание вакансии

Data Science / Machine Learning

Компания: NDA.

Локация: РФ.

Задачи:

Примерно 70% времени вы будете заниматься практической ML-разработкой: писать код, проводить исследования и эксперименты. Остальные 30% времени уйдут на общение, подготовку презентаций и работу с требованиями.

ТРЕБОВАНИЯ

Основные требования

•Опыт в Data Science / Machine Learning от 2 лет.

• Умение четко оценивать сроки и реалистично подходить к постановке задач.

• Прагматизм: готовность искать рабочие решения, а не идеальные, но нереализуемые модели.

• Ответственность: завершать проекты, а не бросать их на полпути.

• Глубокое знание Python, SQL и PySpark:

◦ Разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись).

◦ Оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными).

• Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch).

• Опыт работы с данными: обработка, анализ, feature engineering.

• Общительность и неконфликтность – умение работать в команде и эффективно коммуницировать с коллегами.

Плюсом будет:

• Опыт продакшн-разработки (не только исследования).

• Понимание, как устроены процессы в бизнесе, а не только в Jupyter Notebook.

• Умение запускать ML-модели в PySpark:

◦ Использование Spark MLlib для распределенного обучения.

◦ Работа с PySpark Pandas UDFs для эффективного применения ML-моделей к большим данным.

СТЕК ТЕХНОЛОГИЙ

Data ScienceMachine LearningPythonSQLPySparkScikit-learnTensorFlowPyTorchSpark MLlibPySpark Pandas UDFs

📩 Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • SQL
  • PySpark
  • Scikit-learn
  • TensorFlow
  • PyTorch
  • Spark MLlib
  • ETL
  • Feature Engineering
  • Big Data
  • Pandas

Возможные вопросы на собеседовании

Вакансия делает упор на оптимизацию Spark-запросов. Важно понимать, как кандидат справляется с перекосом данных.

Расскажите о вашем опыте оптимизации Spark-запросов. Как вы боретесь с проблемой Data Skew?

В описании указан прагматизм как ключевое требование. Вопрос проверяет умение выбирать эффективные, а не просто сложные решения.

Приведите пример ситуации, когда вам пришлось отказаться от сложной модели в пользу более простого, но эффективного для бизнеса решения.

Требуется опыт работы с PySpark Pandas UDFs. Это специфический навык для высокопроизводительной обработки.

В каких случаях использование Pandas UDF в PySpark предпочтительнее стандартных Python UDF, и какие есть ограничения?

70% времени — разработка, 30% — коммуникации. Вопрос проверяет навыки сбора требований.

Как вы подходите к процессу сбора требований к ML-модели от бизнес-заказчиков, которые не являются техническими специалистами?

Упомянуто использование Spark MLlib. Важно знать опыт работы с распределенным обучением.

Какие основные отличия и сложности возникают при обучении моделей с использованием Spark MLlib по сравнению с классическим Scikit-learn на одной машине?

Похожие вакансии

NDA
160 000 ₽ – 220 000 ₽

Python разработчик (DWH/Data Engineering)

SeniorУдалённо
Python · SQL · PostgreSQL · ClickHouse · Apache Airflow · Kafka · Debezium · Docker · Kubernetes · Git · CI/CD · Apache Superset · Data Vault 2.0 · Apache Flink · Apache Spark
+15 навыков
NDA
1 900 ₽ – 2 000 ₽

Data Scientist Middle+, Senior

SeniorУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Machine Learning · Data Science · Feature Engineering · Spark MLlib · Pandas
+12 навыков
J
JETLYN
270 000 ₽ – 330 000 ₽

Data Scientist

SeniorУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Spark MLlib · Feature Engineering · Machine Learning · Time Series
+11 навыков
OS
Omega Solutions
150 000 ₽ – 250 000 ₽

Middle+ Data инженер

SeniorУдалённо
SQL · Python · Pandas · NumPy · Airflow · PostgreSQL · ETL
+7 навыков
О«
ООО «Образовательные продукты Русяева»
180 000 ₽ – 250 000 ₽

Backend / ML Infrastructure / MLOps инженер

MiddleУдалённо
Python · TypeScript · PostgreSQL · Qdrant · RAG · LLM · S3 · Sentry · MLOps · Vector Search
+10 навыков
N
Nedvision.ai
от 100 000 ₽

Junior Applied ML Engineer / Data Scientist

JuniorУдалённо
Python · Pandas · NumPy · SQL · Machine Learning · EDA · Feature Engineering · Statistics · Scikit-learn · CatBoost · LightGBM · XGBoost · NLP · geopandas · Airflow · MLflow
+16 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

N
NDA
Россия