yandex
N
NDA
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
УдалённоПолная занятость

Data Scientist

ИИОценка ИИ

Хорошая вакансия для опытных специалистов с сильным инженерным бэкграундом в Big Data. Плюсом является полная удаленка, однако отсутствие названия компании и вилки зарплаты немного снижает прозрачность предложения.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Роль требует серьезного опыта работы с Big Data стеком (PySpark) и умения выводить модели в продакшн, что сложнее обычного анализа данных. Требуется опыт от 3 лет и глубокие знания оптимизации Spark-запросов.

Анализ зарплаты

Медиана350 000 ₽
Рынок250 000 ₽ – 450 000 ₽
ИИОценка ИИ

В объявлении не указана заработная плата, но для специалиста с опытом от 3 лет и навыками PySpark рыночные предложения в РФ и РБ обычно начинаются от 250 000 рублей. Верхняя граница может достигать 450 000 рублей в зависимости от сложности задач и уровня компании.

Сопроводительное письмо

Меня заинтересовала вакансия Data Scientist, так как мой опыт работы с Python, SQL и PySpark более 3 лет полностью соответствует вашим требованиям. Я имею значительный опыт разработки и оптимизации ETL-процессов, включая работу с партиционированием и кэшированием в Spark, что позволяет мне эффективно обрабатывать большие объемы данных.

Помимо построения моделей, я уделяю большое внимание их внедрению в продакшн. У меня есть опыт использования Spark MLlib для распределенного обучения и применения Pandas UDFs для инференса. Я понимаю важность бизнес-контекста и стремлюсь создавать решения, которые приносят реальную ценность компании, выходя за рамки простых исследований в Jupyter Notebook.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Отправьте свое резюме Татьяне прямо сейчас, чтобы присоединиться к команде и работать с большими данными на стеке PySpark!

Описание вакансии

Data Scientist

#DataScientist #Удаленно #РФ #РБ #Remote #Job #Vacancy

Требования:

Опыт в Data Science / Machine Learning от 3-х лет. Глубокое знание Python, SQL и PySpark. Разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись). Оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными). Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch). Опыт с данными: обработка, анализ, feature engineering. Опыт продакшн-разработки (не только исследования). Понимание, как устроены процессы в бизнесе, а не только в Jupyter Notebook. Умение запускать ML-модели в PySpark: использование Spark MLlib для распределенного обучения, работа с PySpark Pandas UDFs для эффективного применения ML-моделей к большим данным.

Локация:*📍*Удалённо из РФ, РБ.

Контакт для отклика: Откликнуться или Откликнуться +CV

*👉* Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • SQL
  • PySpark
  • ETL
  • Machine Learning
  • Scikit-learn
  • TensorFlow
  • PyTorch
  • Big Data
  • Feature Engineering
  • Spark MLlib

Возможные вопросы на собеседовании

Проверка навыков оптимизации производительности при работе с большими данными.

Расскажите о вашем опыте оптимизации Spark-запросов. В каких случаях вы используете broadcast-переменные и как боретесь с проблемой data skew?

Оценка умения работать с распределенным машинным обучением.

В чем основные отличия и ограничения использования Spark MLlib по сравнению с классическим Scikit-learn?

Проверка навыков написания эффективного кода для обработки данных.

Когда стоит использовать Pandas UDFs в PySpark и какие преимущества в производительности они дают по сравнению с обычными Python UDFs?

Оценка опыта интеграции моделей в реальные системы.

Опишите ваш типичный процесс вывода ML-модели в продакшн. Как вы обеспечиваете мониторинг качества модели после деплоя?

Проверка понимания бизнес-ценности разработки.

Приведите пример, когда разработанная вами модель напрямую повлияла на бизнес-показатели. Как вы оценивали этот эффект?

Похожие вакансии

NDA
160 000 ₽ – 220 000 ₽

Python разработчик (DWH/Data Engineering)

SeniorУдалённо
Python · SQL · PostgreSQL · ClickHouse · Apache Airflow · Kafka · Debezium · Docker · Kubernetes · Git · CI/CD · Apache Superset · Data Vault 2.0 · Apache Flink · Apache Spark
+15 навыков
NDA
1 900 ₽ – 2 000 ₽

Data Scientist Middle+, Senior

SeniorУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Machine Learning · Data Science · Feature Engineering · Spark MLlib · Pandas
+12 навыков
J
JETLYN
270 000 ₽ – 330 000 ₽

Data Scientist

SeniorУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Spark MLlib · Feature Engineering · Machine Learning · Time Series
+11 навыков
OS
Omega Solutions
150 000 ₽ – 250 000 ₽

Middle+ Data инженер

SeniorУдалённо
SQL · Python · Pandas · NumPy · Airflow · PostgreSQL · ETL
+7 навыков
M
MIA-Dev
280 000 ₽ – 330 000 ₽

Data Engineer

Удалённо
Python · SQL · Apache Airflow · Apache Spark · Kafka · RabbitMQ · ETL · DWH
+8 навыков
О«
ООО «Образовательные продукты Русяева»
180 000 ₽ – 250 000 ₽

Backend / ML Infrastructure / MLOps инженер

MiddleУдалённо
Python · TypeScript · PostgreSQL · Qdrant · RAG · LLM · S3 · Sentry · MLOps · Vector Search
+10 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

N
NDA
Россия