Откликайтесь
на вакансии с ИИ

Middle Data Scientist
Привлекательная вакансия для Middle-специалиста с возможностью удаленной работы по всему миру и современным технологическим стеком. Четко прописанные обязанности и требования к MLOps делают роль перспективной для профессионального роста.
Сложность вакансии
Позиция требует уверенного владения широким стеком (от классического ML до PySpark и MLOps) и наличия 3+ лет коммерческого опыта. Дополнительную сложность добавляет необходимость свободного владения английским языком на уровне B2+.
Анализ зарплаты
Зарплата в вакансии не указана, однако для Middle Data Scientist с навыками PySpark и английским B2 на международном рынке (outstaff/outsource) медиана составляет около $4500-$5500. Предложения могут сильно варьироваться в зависимости от локации заказчика.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Присоединяйтесь к команде и создавайте передовые ML-решения на глобальном уровне — откликнитесь прямо сейчас!
Описание вакансии
#lookfor #outsource #outstaff #remote #DataScientist #MachineLearning #Python #SQL #PySpark #ML #DeepLearning #ScikitLearn
We are looking for a Middle Data Scientist to join our data team on a full-time remote basis.
The specialist will develop, validate, and deploy machine learning models, building end-to-end ML pipelines from data exploration and feature engineering to production deployment.
Key responsibilities:
• Develop, train, and validate ML models for classification, regression, forecasting, and clustering.
• Perform exploratory data analysis (EDA) and design feature engineering pipelines.
• Build and maintain end-to-end ML workflows: preprocessing, training, evaluation, and deployment.
• Work with structured and unstructured data using SQL, Python, and PySpark.
• Implement and tune models using Scikit-learn, XGBoost, LightGBM, CatBoost, TensorFlow, or PyTorch.
• Evaluate model performance with metrics, cross-validation, and A/B testing.
• Deploy models to production and monitor performance over time.
• Collaborate with data engineers on pipelines and feature stores.
• Translate business requirements into data science tasks and present results to stakeholders.
• Document model architectures, experiments, and methodologies.
Requirements:
• 3+ years of commercial experience in Data Science or Machine Learning.
• Strong Python proficiency for data analysis, modeling, and automation.
• Expert-level SQL skills for data extraction, aggregation, and complex querying.
• Hands-on experience with PySpark for distributed data processing.
• Solid understanding of classical ML algorithms and practical applications.
• Experience with Scikit-learn, XGBoost, LightGBM, CatBoost, TensorFlow, or PyTorch.
• Strong foundation in statistics, probability, and mathematical optimization.
• Experience with feature engineering, dimensionality reduction, and model selection.
• Understanding of MLOps concepts: model versioning, experiment tracking, and deployment.
• Familiarity with MLflow, Kubeflow, DVC, or Weights & Biases.
• Experience with cloud ML platforms (AWS SageMaker, Azure ML, or Vertex AI).
• Knowledge of A/B testing, causal inference, and data visualization tools.
• Strong analytical thinking and ability to translate business problems into data-driven solutions.
• English: B2 or higher (written and spoken).
Nice to have:
• Experience with NLP (spaCy, NLTK, Hugging Face) or computer vision (OpenCV, Detectron2).
• Knowledge of Bayesian methods, time series forecasting, or graph-based ML.
• Contributions to Kaggle competitions, open-source ML projects, or research publications.
Location: Remote, worldwide
Restrictions: Candidates from Egypt, India, Pakistan, and Afghanistan are not considered
English: B2+
Format: Full-time, outsource, outstaff
Contact: Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- SQL
- PySpark
- Machine Learning
- Deep Learning
- Scikit-learn
- XGBoost
- LightGBM
- CatBoost
- TensorFlow
- PyTorch
- MLflow
- Kubeflow
- DVC
- Weights & Biases
- AWS SageMaker
- Azure Machine Learning
- Vertex AI
- NLP
- Computer Vision
Возможные вопросы на собеседовании
Проверка навыков работы с большими данными, указанных в требованиях.
Расскажите о вашем опыте работы с PySpark: в каких случаях вы предпочитаете его обычному Pandas и с какими проблемами оптимизации сталкивались?
Оценка понимания жизненного цикла модели и MLOps.
Как вы организуете процесс деплоя и мониторинга моделей в продакшене? Какие инструменты (MLflow, DVC и др.) вы использовали для трекинга экспериментов?
Проверка глубины знаний алгоритмов градиентного бустинга.
В чем ключевые различия между XGBoost, LightGBM и CatBoost? В каких сценариях вы выберете конкретную библиотеку?
Оценка навыков статистического анализа и проверки гипотез.
Как вы подходите к дизайну и анализу результатов A/B тестов, особенно если данные имеют высокую дисперсию?
Проверка умения работать с признаками.
Опишите ваш подход к Feature Engineering для задачи с большим количеством пропущенных значений и категориальных признаков высокой мощности.
Похожие вакансии
Middle+ Data Engineer
Backend / ML Infrastructure / MLOps инженер
Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы
Специалист по науке о данных прогнозирования
ML Engineer
Backend / ML Infrastructure / MLOps инженер (ИИ-ассистент)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!