yandex
N
NDA
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
MiddleУдалённоПолная занятость

Middle Data Scientist

ИИОценка ИИ

Привлекательная вакансия для Middle-специалиста с возможностью удаленной работы по всему миру и современным технологическим стеком. Четко прописанные обязанности и требования к MLOps делают роль перспективной для профессионального роста.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Позиция требует уверенного владения широким стеком (от классического ML до PySpark и MLOps) и наличия 3+ лет коммерческого опыта. Дополнительную сложность добавляет необходимость свободного владения английским языком на уровне B2+.

Анализ зарплаты

Медиана5 000 $
Рынок3 500 $ – 6 500 $
ИИОценка ИИ

Зарплата в вакансии не указана, однако для Middle Data Scientist с навыками PySpark и английским B2 на международном рынке (outstaff/outsource) медиана составляет около $4500-$5500. Предложения могут сильно варьироваться в зависимости от локации заказчика.

Сопроводительное письмо

I am writing to express my interest in the Middle Data Scientist position. With over 3 years of commercial experience in developing and deploying machine learning models, I have built a strong foundation in Python, SQL, and PySpark, which aligns perfectly with your team's requirements for end-to-end ML pipeline development.

In my previous roles, I have successfully implemented models using XGBoost and CatBoost, and I am well-versed in MLOps practices, including experiment tracking with MLflow. My experience in translating complex business requirements into actionable data science tasks, combined with my B2-level English proficiency, makes me a strong candidate for this remote role.

I am particularly drawn to this opportunity because of the focus on building production-ready workflows and the chance to work with distributed data processing. I am eager to bring my analytical mindset and technical expertise to your data team.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Присоединяйтесь к команде и создавайте передовые ML-решения на глобальном уровне — откликнитесь прямо сейчас!

Описание вакансии

#lookfor #outsource #outstaff #remote #DataScientist #MachineLearning #Python #SQL #PySpark #ML #DeepLearning #ScikitLearn

We are looking for a Middle Data Scientist to join our data team on a full-time remote basis.

The specialist will develop, validate, and deploy machine learning models, building end-to-end ML pipelines from data exploration and feature engineering to production deployment.

Key responsibilities:

• Develop, train, and validate ML models for classification, regression, forecasting, and clustering.

• Perform exploratory data analysis (EDA) and design feature engineering pipelines.

• Build and maintain end-to-end ML workflows: preprocessing, training, evaluation, and deployment.

• Work with structured and unstructured data using SQL, Python, and PySpark.

• Implement and tune models using Scikit-learn, XGBoost, LightGBM, CatBoost, TensorFlow, or PyTorch.

• Evaluate model performance with metrics, cross-validation, and A/B testing.

• Deploy models to production and monitor performance over time.

• Collaborate with data engineers on pipelines and feature stores.

• Translate business requirements into data science tasks and present results to stakeholders.

• Document model architectures, experiments, and methodologies.

Requirements:

• 3+ years of commercial experience in Data Science or Machine Learning.

• Strong Python proficiency for data analysis, modeling, and automation.

• Expert-level SQL skills for data extraction, aggregation, and complex querying.

• Hands-on experience with PySpark for distributed data processing.

• Solid understanding of classical ML algorithms and practical applications.

• Experience with Scikit-learn, XGBoost, LightGBM, CatBoost, TensorFlow, or PyTorch.

• Strong foundation in statistics, probability, and mathematical optimization.

• Experience with feature engineering, dimensionality reduction, and model selection.

• Understanding of MLOps concepts: model versioning, experiment tracking, and deployment.

• Familiarity with MLflow, Kubeflow, DVC, or Weights & Biases.

• Experience with cloud ML platforms (AWS SageMaker, Azure ML, or Vertex AI).

• Knowledge of A/B testing, causal inference, and data visualization tools.

• Strong analytical thinking and ability to translate business problems into data-driven solutions.

• English: B2 or higher (written and spoken).

Nice to have:

• Experience with NLP (spaCy, NLTK, Hugging Face) or computer vision (OpenCV, Detectron2).

• Knowledge of Bayesian methods, time series forecasting, or graph-based ML.

• Contributions to Kaggle competitions, open-source ML projects, or research publications.

Location: Remote, worldwide

Restrictions: Candidates from Egypt, India, Pakistan, and Afghanistan are not considered

English: B2+

Format: Full-time, outsource, outstaff

Contact: Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • SQL
  • PySpark
  • Machine Learning
  • Deep Learning
  • Scikit-learn
  • XGBoost
  • LightGBM
  • CatBoost
  • TensorFlow
  • PyTorch
  • MLflow
  • Kubeflow
  • DVC
  • Weights & Biases
  • AWS SageMaker
  • Azure Machine Learning
  • Vertex AI
  • NLP
  • Computer Vision

Возможные вопросы на собеседовании

Проверка навыков работы с большими данными, указанных в требованиях.

Расскажите о вашем опыте работы с PySpark: в каких случаях вы предпочитаете его обычному Pandas и с какими проблемами оптимизации сталкивались?

Оценка понимания жизненного цикла модели и MLOps.

Как вы организуете процесс деплоя и мониторинга моделей в продакшене? Какие инструменты (MLflow, DVC и др.) вы использовали для трекинга экспериментов?

Проверка глубины знаний алгоритмов градиентного бустинга.

В чем ключевые различия между XGBoost, LightGBM и CatBoost? В каких сценариях вы выберете конкретную библиотеку?

Оценка навыков статистического анализа и проверки гипотез.

Как вы подходите к дизайну и анализу результатов A/B тестов, особенно если данные имеют высокую дисперсию?

Проверка умения работать с признаками.

Опишите ваш подход к Feature Engineering для задачи с большим количеством пропущенных значений и категориальных признаков высокой мощности.

Похожие вакансии

NDA
Не указана

Middle+ Data Engineer

MiddleУдалённо
Databricks · Unity Catalog · Delta Lake · Terraform · Python · Spark · PySpark · SQL · Infrastructure as Code · AWS · GCP
+11 навыков
О«
ООО «Образовательные продукты Русяева»
180 000 ₽ – 250 000 ₽

Backend / ML Infrastructure / MLOps инженер

MiddleУдалённо
Python · TypeScript · PostgreSQL · Qdrant · RAG · LLM · S3 · Sentry · MLOps · Vector Search
+10 навыков
O
Ozon
Не указана

Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы

MiddleУдалённо
Python · NLP · LLM · Machine Learning · Data Science
+5 навыков
E
Ekleft
Не указана

Специалист по науке о данных прогнозирования

MiddleУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Machine Learning · Data Analysis · Feature Engineering · Spark MLlib · Pandas
+12 навыков
A
Aston
Не указана

ML Engineer

MiddleУдалённо
Apache Kafka · REST · JSON · HTTP · WebSockets · RESTful API · LangGraph · Git · Docker
+9 навыков
О«
ООО «Образовательные продукты Русяева»
180 000 ₽ – 250 000 ₽

Backend / ML Infrastructure / MLOps инженер (ИИ-ассистент)

MiddleУдалённо
Python · TypeScript · PostgreSQL · Qdrant · RAG · LLM · MLOps · S3 · Sentry · Vector Search
+10 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

N
NDA