Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

УдалённоПолная занятость

Data Science / Machine Learning Engineer

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Хорошая вакансия для специалистов среднего уровня (Middle) с акцентом на Big Data. Четкое разделение рабочего времени и понятный стек технологий делают предложение привлекательным, несмотря на отсутствие названия компании.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Позиция требует уверенного владения стеком Big Data (PySpark, SQL) и опыта в ML от 2 лет. Основная сложность заключается в необходимости сочетать технические навыки с бизнес-ориентированным подходом и умением оптимизировать распределенные вычисления.

Анализ зарплаты

Медиана270 000 ₽

Рынок200 000 ₽ – 350 000 ₽

В объявлении не указана заработная плата, однако для специалистов уровня Middle Data Scientist с навыками PySpark в РФ рыночный диапазон составляет от 200 000 до 350 000 рублей. Данная роль предполагает работу с большими данными, что обычно оплачивается выше среднего по рынку ML.

Меня заинтересовала вакансия Data Science / Machine Learning инженера, так как мой опыт и подход к разработке полностью соответствуют вашим требованиям. Я обладаю более чем двухлетним опытом в области машинного обучения и глубокими знаниями Python, SQL и PySpark. В своей работе я придерживаюсь принципа прагматизма, фокусируясь на создании работающих бизнес-решений и эффективной оптимизации Spark-запросов для обработки больших данных.

Особенно меня привлекла возможность совмещать глубокую техническую разработку (70% времени) с коммуникацией и работой над требованиями. Я имею опыт построения ETL-процессов и внедрения моделей в продакшн, что позволяет мне не просто проводить исследования в Jupyter Notebook, но и доводить проекты до логического завершения. Буду рад обсудить, как мой опыт в ML и навыки работы с PySpark помогут вашей команде в решении текущих задач.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Если вы готовы создавать прагматичные ML-решения и работать с большими данными на PySpark, откликайтесь прямо сейчас!

Описание вакансии

Data Science / Machine Learning

Компания: NDA.

Локация: РФ.

Задачи:

Примерно 70% времени вы будете заниматься практической ML-разработкой: писать код, проводить исследования и эксперименты. Остальные 30% времени уйдут на общение, подготовку презентаций и работу с требованиями.

ТРЕБОВАНИЯ

Основные требования

•Опыт в Data Science / Machine Learning от 2 лет.

• Умение четко оценивать сроки и реалистично подходить к постановке задач.

• Прагматизм: готовность искать рабочие решения, а не идеальные, но нереализуемые модели.

• Ответственность: завершать проекты, а не бросать их на полпути.

• Глубокое знание Python, SQL и PySpark:

◦ Разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись).

◦ Оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными).

• Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch).

• Опыт работы с данными: обработка, анализ, feature engineering.

• Общительность и неконфликтность – умение работать в команде и эффективно коммуницировать с коллегами.

Плюсом будет:

• Опыт продакшн-разработки (не только исследования).

• Понимание, как устроены процессы в бизнесе, а не только в Jupyter Notebook.

• Умение запускать ML-модели в PySpark:

◦ Использование Spark MLlib для распределенного обучения.

◦ Работа с PySpark Pandas UDFs для эффективного применения ML-моделей к большим данным.

СТЕК ТЕХНОЛОГИЙ

Data ScienceMachine LearningPythonSQLPySparkScikit-learnTensorFlowPyTorchSpark MLlibPySpark Pandas UDFs

📩 Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
SQL
PySpark
Scikit-learn
TensorFlow
PyTorch
Spark MLlib
ETL
Feature Engineering
Big Data
Pandas

Возможные вопросы на собеседовании

Вакансия делает упор на оптимизацию Spark-запросов. Важно понимать, как кандидат справляется с перекосом данных.

Расскажите о вашем опыте оптимизации Spark-запросов. Как вы боретесь с проблемой Data Skew?

В описании указан прагматизм как ключевое требование. Вопрос проверяет умение выбирать эффективные, а не просто сложные решения.

Приведите пример ситуации, когда вам пришлось отказаться от сложной модели в пользу более простого, но эффективного для бизнеса решения.

Требуется опыт работы с PySpark Pandas UDFs. Это специфический навык для высокопроизводительной обработки.

В каких случаях использование Pandas UDF в PySpark предпочтительнее стандартных Python UDF, и какие есть ограничения?

70% времени — разработка, 30% — коммуникации. Вопрос проверяет навыки сбора требований.

Как вы подходите к процессу сбора требований к ML-модели от бизнес-заказчиков, которые не являются техническими специалистами?

Упомянуто использование Spark MLlib. Важно знать опыт работы с распределенным обучением.

Какие основные отличия и сложности возникают при обучении моделей с использованием Spark MLlib по сравнению с классическим Scikit-learn на одной машине?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

Data Science / Machine Learning Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте оптимизации Spark-запросов. Как вы боретесь с проблемой Data Skew?

Приведите пример ситуации, когда вам пришлось отказаться от сложной модели в пользу более простого, но эффективного для бизнеса решения.

В каких случаях использование Pandas UDF в PySpark предпочтительнее стандартных Python UDF, и какие есть ограничения?

Как вы подходите к процессу сбора требований к ML-модели от бизнес-заказчиков, которые не являются техническими специалистами?

Какие основные отличия и сложности возникают при обучении моделей с использованием Spark MLlib по сравнению с классическим Scikit-learn на одной машине?

Похожие вакансии

Python разработчик (DWH/Data Engineering)

Data Scientist Middle+, Senior

Data Scientist

Middle+ Data инженер

Backend / ML Infrastructure / MLOps инженер

Junior Applied ML Engineer / Data Scientist

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Data Science / Machine Learning Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте оптимизации Spark-запросов. Как вы боретесь с проблемой Data Skew?

Приведите пример ситуации, когда вам пришлось отказаться от сложной модели в пользу более простого, но эффективного для бизнеса решения.

В каких случаях использование Pandas UDF в PySpark предпочтительнее стандартных Python UDF, и какие есть ограничения?

Как вы подходите к процессу сбора требований к ML-модели от бизнес-заказчиков, которые не являются техническими специалистами?

Какие основные отличия и сложности возникают при обучении моделей с использованием Spark MLlib по сравнению с классическим Scikit-learn на одной машине?

Похожие вакансии

Python разработчик (DWH/Data Engineering)

Data Scientist Middle+, Senior

Data Scientist

Middle+ Data инженер

Backend / ML Infrastructure / MLOps инженер

Junior Applied ML Engineer / Data Scientist

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ