- Страна
- Россия
Откликайтесь
на вакансии с ИИ

Data Scientist
Хорошая вакансия для опытных специалистов с сильным инженерным бэкграундом в Big Data. Плюсом является полная удаленка, однако отсутствие названия компании и вилки зарплаты немного снижает прозрачность предложения.
Сложность вакансии
Роль требует серьезного опыта работы с Big Data стеком (PySpark) и умения выводить модели в продакшн, что сложнее обычного анализа данных. Требуется опыт от 3 лет и глубокие знания оптимизации Spark-запросов.
Анализ зарплаты
В объявлении не указана заработная плата, но для специалиста с опытом от 3 лет и навыками PySpark рыночные предложения в РФ и РБ обычно начинаются от 250 000 рублей. Верхняя граница может достигать 450 000 рублей в зависимости от сложности задач и уровня компании.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Отправьте свое резюме Татьяне прямо сейчас, чтобы присоединиться к команде и работать с большими данными на стеке PySpark!
Описание вакансии
Data Scientist
#DataScientist #Удаленно #РФ #РБ #Remote #Job #Vacancy
Требования:
Опыт в Data Science / Machine Learning от 3-х лет. Глубокое знание Python, SQL и PySpark. Разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись). Оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными). Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch). Опыт с данными: обработка, анализ, feature engineering. Опыт продакшн-разработки (не только исследования). Понимание, как устроены процессы в бизнесе, а не только в Jupyter Notebook. Умение запускать ML-модели в PySpark: использование Spark MLlib для распределенного обучения, работа с PySpark Pandas UDFs для эффективного применения ML-моделей к большим данным.
Локация:*📍*Удалённо из РФ, РБ.
Контакт для отклика: Откликнуться или Откликнуться +CV
*👉* Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- SQL
- PySpark
- ETL
- Machine Learning
- Scikit-learn
- TensorFlow
- PyTorch
- Big Data
- Feature Engineering
- Spark MLlib
Возможные вопросы на собеседовании
Проверка навыков оптимизации производительности при работе с большими данными.
Расскажите о вашем опыте оптимизации Spark-запросов. В каких случаях вы используете broadcast-переменные и как боретесь с проблемой data skew?
Оценка умения работать с распределенным машинным обучением.
В чем основные отличия и ограничения использования Spark MLlib по сравнению с классическим Scikit-learn?
Проверка навыков написания эффективного кода для обработки данных.
Когда стоит использовать Pandas UDFs в PySpark и какие преимущества в производительности они дают по сравнению с обычными Python UDFs?
Оценка опыта интеграции моделей в реальные системы.
Опишите ваш типичный процесс вывода ML-модели в продакшн. Как вы обеспечиваете мониторинг качества модели после деплоя?
Проверка понимания бизнес-ценности разработки.
Приведите пример, когда разработанная вами модель напрямую повлияла на бизнес-показатели. Как вы оценивали этот эффект?
Похожие вакансии
Python разработчик (DWH/Data Engineering)
Data Scientist Middle+, Senior
Data Scientist
Middle+ Data инженер
Data Engineer
Backend / ML Infrastructure / MLOps инженер
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!