Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

УдалённоПолная занятость

Data Scientist

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Хорошая вакансия для опытных специалистов с сильным инженерным бэкграундом в Big Data. Плюсом является полная удаленка, однако отсутствие названия компании и вилки зарплаты немного снижает прозрачность предложения.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует серьезного опыта работы с Big Data стеком (PySpark) и умения выводить модели в продакшн, что сложнее обычного анализа данных. Требуется опыт от 3 лет и глубокие знания оптимизации Spark-запросов.

Анализ зарплаты

Медиана350 000 ₽

Рынок250 000 ₽ – 450 000 ₽

В объявлении не указана заработная плата, но для специалиста с опытом от 3 лет и навыками PySpark рыночные предложения в РФ и РБ обычно начинаются от 250 000 рублей. Верхняя граница может достигать 450 000 рублей в зависимости от сложности задач и уровня компании.

Меня заинтересовала вакансия Data Scientist, так как мой опыт работы с Python, SQL и PySpark более 3 лет полностью соответствует вашим требованиям. Я имею значительный опыт разработки и оптимизации ETL-процессов, включая работу с партиционированием и кэшированием в Spark, что позволяет мне эффективно обрабатывать большие объемы данных.

Помимо построения моделей, я уделяю большое внимание их внедрению в продакшн. У меня есть опыт использования Spark MLlib для распределенного обучения и применения Pandas UDFs для инференса. Я понимаю важность бизнес-контекста и стремлюсь создавать решения, которые приносят реальную ценность компании, выходя за рамки простых исследований в Jupyter Notebook.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Отправьте свое резюме Татьяне прямо сейчас, чтобы присоединиться к команде и работать с большими данными на стеке PySpark!

Описание вакансии

Data Scientist

#DataScientist #Удаленно #РФ #РБ #Remote #Job #Vacancy

Требования:

Опыт в Data Science / Machine Learning от 3-х лет. Глубокое знание Python, SQL и PySpark. Разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись). Оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными). Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch). Опыт с данными: обработка, анализ, feature engineering. Опыт продакшн-разработки (не только исследования). Понимание, как устроены процессы в бизнесе, а не только в Jupyter Notebook. Умение запускать ML-модели в PySpark: использование Spark MLlib для распределенного обучения, работа с PySpark Pandas UDFs для эффективного применения ML-моделей к большим данным.

Локация:*📍*Удалённо из РФ, РБ.

Контакт для отклика: Откликнуться или Откликнуться +CV

*👉* Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
SQL
PySpark
ETL
Machine Learning
Scikit-learn
TensorFlow
PyTorch
Big Data
Feature Engineering
Spark MLlib

Возможные вопросы на собеседовании

Проверка навыков оптимизации производительности при работе с большими данными.

Расскажите о вашем опыте оптимизации Spark-запросов. В каких случаях вы используете broadcast-переменные и как боретесь с проблемой data skew?

Оценка умения работать с распределенным машинным обучением.

В чем основные отличия и ограничения использования Spark MLlib по сравнению с классическим Scikit-learn?

Проверка навыков написания эффективного кода для обработки данных.

Когда стоит использовать Pandas UDFs в PySpark и какие преимущества в производительности они дают по сравнению с обычными Python UDFs?

Оценка опыта интеграции моделей в реальные системы.

Опишите ваш типичный процесс вывода ML-модели в продакшн. Как вы обеспечиваете мониторинг качества модели после деплоя?

Проверка понимания бизнес-ценности разработки.

Приведите пример, когда разработанная вами модель напрямую повлияла на бизнес-показатели. Как вы оценивали этот эффект?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

Data Scientist

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте оптимизации Spark-запросов. В каких случаях вы используете broadcast-переменные и как боретесь с проблемой data skew?

В чем основные отличия и ограничения использования Spark MLlib по сравнению с классическим Scikit-learn?

Когда стоит использовать Pandas UDFs в PySpark и какие преимущества в производительности они дают по сравнению с обычными Python UDFs?

Опишите ваш типичный процесс вывода ML-модели в продакшн. Как вы обеспечиваете мониторинг качества модели после деплоя?

Приведите пример, когда разработанная вами модель напрямую повлияла на бизнес-показатели. Как вы оценивали этот эффект?

Похожие вакансии

Python разработчик (DWH/Data Engineering)

Data Scientist Middle+, Senior

Data Scientist

Middle+ Data инженер

Data Engineer

Backend / ML Infrastructure / MLOps инженер

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Data Scientist

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте оптимизации Spark-запросов. В каких случаях вы используете broadcast-переменные и как боретесь с проблемой data skew?

В чем основные отличия и ограничения использования Spark MLlib по сравнению с классическим Scikit-learn?

Когда стоит использовать Pandas UDFs в PySpark и какие преимущества в производительности они дают по сравнению с обычными Python UDFs?

Опишите ваш типичный процесс вывода ML-модели в продакшн. Как вы обеспечиваете мониторинг качества модели после деплоя?

Приведите пример, когда разработанная вами модель напрямую повлияла на бизнес-показатели. Как вы оценивали этот эффект?

Похожие вакансии

Python разработчик (DWH/Data Engineering)

Data Scientist Middle+, Senior

Data Scientist

Middle+ Data инженер

Data Engineer

Backend / ML Infrastructure / MLOps инженер

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ