+500% приглашений

Откликайтесь
на вакансии с ИИ

MiddleУдалённоПолная занятость

Middle Data Scientist

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Привлекательная вакансия для Middle-специалиста с возможностью удаленной работы по всему миру и современным технологическим стеком. Четко прописанные обязанности и требования к MLOps делают роль перспективной для профессионального роста.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Позиция требует уверенного владения широким стеком (от классического ML до PySpark и MLOps) и наличия 3+ лет коммерческого опыта. Дополнительную сложность добавляет необходимость свободного владения английским языком на уровне B2+.

Анализ зарплаты

Медиана5 000 $

Рынок3 500 $ – 6 500 $

Зарплата в вакансии не указана, однако для Middle Data Scientist с навыками PySpark и английским B2 на международном рынке (outstaff/outsource) медиана составляет около $4500-$5500. Предложения могут сильно варьироваться в зависимости от локации заказчика.

I am writing to express my interest in the Middle Data Scientist position. With over 3 years of commercial experience in developing and deploying machine learning models, I have built a strong foundation in Python, SQL, and PySpark, which aligns perfectly with your team's requirements for end-to-end ML pipeline development.

In my previous roles, I have successfully implemented models using XGBoost and CatBoost, and I am well-versed in MLOps practices, including experiment tracking with MLflow. My experience in translating complex business requirements into actionable data science tasks, combined with my B2-level English proficiency, makes me a strong candidate for this remote role.

I am particularly drawn to this opportunity because of the focus on building production-ready workflows and the chance to work with distributed data processing. I am eager to bring my analytical mindset and technical expertise to your data team.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Присоединяйтесь к команде и создавайте передовые ML-решения на глобальном уровне — откликнитесь прямо сейчас!

Описание вакансии

#lookfor #outsource #outstaff #remote #DataScientist #MachineLearning #Python #SQL #PySpark #ML #DeepLearning #ScikitLearn

We are looking for a Middle Data Scientist to join our data team on a full-time remote basis.

The specialist will develop, validate, and deploy machine learning models, building end-to-end ML pipelines from data exploration and feature engineering to production deployment.

Key responsibilities:

• Develop, train, and validate ML models for classification, regression, forecasting, and clustering.

• Perform exploratory data analysis (EDA) and design feature engineering pipelines.

• Build and maintain end-to-end ML workflows: preprocessing, training, evaluation, and deployment.

• Work with structured and unstructured data using SQL, Python, and PySpark.

• Implement and tune models using Scikit-learn, XGBoost, LightGBM, CatBoost, TensorFlow, or PyTorch.

• Evaluate model performance with metrics, cross-validation, and A/B testing.

• Deploy models to production and monitor performance over time.

• Collaborate with data engineers on pipelines and feature stores.

• Translate business requirements into data science tasks and present results to stakeholders.

• Document model architectures, experiments, and methodologies.

Requirements:

• 3+ years of commercial experience in Data Science or Machine Learning.

• Strong Python proficiency for data analysis, modeling, and automation.

• Expert-level SQL skills for data extraction, aggregation, and complex querying.

• Hands-on experience with PySpark for distributed data processing.

• Solid understanding of classical ML algorithms and practical applications.

• Experience with Scikit-learn, XGBoost, LightGBM, CatBoost, TensorFlow, or PyTorch.

• Strong foundation in statistics, probability, and mathematical optimization.

• Experience with feature engineering, dimensionality reduction, and model selection.

• Understanding of MLOps concepts: model versioning, experiment tracking, and deployment.

• Familiarity with MLflow, Kubeflow, DVC, or Weights & Biases.

• Experience with cloud ML platforms (AWS SageMaker, Azure ML, or Vertex AI).

• Knowledge of A/B testing, causal inference, and data visualization tools.

• Strong analytical thinking and ability to translate business problems into data-driven solutions.

• English: B2 or higher (written and spoken).

Nice to have:

• Experience with NLP (spaCy, NLTK, Hugging Face) or computer vision (OpenCV, Detectron2).

• Knowledge of Bayesian methods, time series forecasting, or graph-based ML.

• Contributions to Kaggle competitions, open-source ML projects, or research publications.

Location: Remote, worldwide

Restrictions: Candidates from Egypt, India, Pakistan, and Afghanistan are not considered

English: B2+

Format: Full-time, outsource, outstaff

Contact: Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
SQL
PySpark
Machine Learning
Deep Learning
Scikit-learn
XGBoost
LightGBM
CatBoost
TensorFlow
PyTorch
MLflow
Kubeflow
DVC
Weights & Biases
AWS SageMaker
Azure Machine Learning
Vertex AI
NLP
Computer Vision

Возможные вопросы на собеседовании

Проверка навыков работы с большими данными, указанных в требованиях.

Расскажите о вашем опыте работы с PySpark: в каких случаях вы предпочитаете его обычному Pandas и с какими проблемами оптимизации сталкивались?

Оценка понимания жизненного цикла модели и MLOps.

Как вы организуете процесс деплоя и мониторинга моделей в продакшене? Какие инструменты (MLflow, DVC и др.) вы использовали для трекинга экспериментов?

Проверка глубины знаний алгоритмов градиентного бустинга.

В чем ключевые различия между XGBoost, LightGBM и CatBoost? В каких сценариях вы выберете конкретную библиотеку?

Оценка навыков статистического анализа и проверки гипотез.

Как вы подходите к дизайну и анализу результатов A/B тестов, особенно если данные имеют высокую дисперсию?

Проверка умения работать с признаками.

Опишите ваш подход к Feature Engineering для задачи с большим количеством пропущенных значений и категориальных признаков высокой мощности.

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Откликайтесь
на вакансии с ИИ

Middle Data Scientist

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте работы с PySpark: в каких случаях вы предпочитаете его обычному Pandas и с какими проблемами оптимизации сталкивались?

Как вы организуете процесс деплоя и мониторинга моделей в продакшене? Какие инструменты (MLflow, DVC и др.) вы использовали для трекинга экспериментов?

В чем ключевые различия между XGBoost, LightGBM и CatBoost? В каких сценариях вы выберете конкретную библиотеку?

Как вы подходите к дизайну и анализу результатов A/B тестов, особенно если данные имеют высокую дисперсию?

Опишите ваш подход к Feature Engineering для задачи с большим количеством пропущенных значений и категориальных признаков высокой мощности.

Похожие вакансии

Middle+ Data Engineer

Backend / ML Infrastructure / MLOps инженер

Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы

Специалист по науке о данных прогнозирования

ML Engineer

Backend / ML Infrastructure / MLOps инженер (ИИ-ассистент)

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Middle Data Scientist

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте работы с PySpark: в каких случаях вы предпочитаете его обычному Pandas и с какими проблемами оптимизации сталкивались?

Как вы организуете процесс деплоя и мониторинга моделей в продакшене? Какие инструменты (MLflow, DVC и др.) вы использовали для трекинга экспериментов?

В чем ключевые различия между XGBoost, LightGBM и CatBoost? В каких сценариях вы выберете конкретную библиотеку?

Как вы подходите к дизайну и анализу результатов A/B тестов, особенно если данные имеют высокую дисперсию?

Опишите ваш подход к Feature Engineering для задачи с большим количеством пропущенных значений и категориальных признаков высокой мощности.

Похожие вакансии

Middle+ Data Engineer

Backend / ML Infrastructure / MLOps инженер

Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы

Специалист по науке о данных прогнозирования

ML Engineer

Backend / ML Infrastructure / MLOps инженер (ИИ-ассистент)

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ