yandex
N
NDA
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorУдалённоКонтракт

ML/DS-разработчик (дедупликация и feature store)

ИИОценка ИИ

Интересная R&D роль с возможностью строить системы с нуля. Однако отсутствие указанной зарплаты и жесткие ограничения по локации (только РФ/РБ) снижают общую привлекательность.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Роль Senior уровня требует не только глубоких знаний ML-стека (PyTorch, PySpark), но и архитектурных навыков для создания систем с нуля (дедупликация, Feature Store). Ограничения по локации и специфические требования к образованию повышают порог входа.

Анализ зарплаты

Медиана400 000 ₽
Рынок300 000 ₽ – 550 000 ₽
ИИОценка ИИ

В вакансии не указан уровень дохода, однако для позиции Senior ML Engineer в РФ и РБ рыночный диапазон составляет от 300 000 до 500 000 рублей. Предложение будет конкурентоспособным, если попадет в эти рамки.

Сопроводительное письмо

Меня заинтересовала вакансия Senior ML/DS-разработчика, особенно задачи по созданию системы дедупликации и развитию Feature Store. Имея опыт работы с PySpark и построением сложных ML-пайплайнов, я готов взять на себя ответственность за проектирование архитектуры этих систем с нуля.

Мой технический стек полностью совпадает с вашими требованиями: я свободно владею Python, SQL и имею глубокую экспертизу в работе с Big Data инструментами (Hive, PySpark). Также я обладаю опытом формирования устойчивых векторов признаков, что критически важно для качественного клиентского профиля.

Буду рад обсудить, как мой опыт в R&D и владение современными фреймворками машинного обучения помогут вашей команде эффективно решить задачи по очистке данных и оптимизации инфраструктуры признаков.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Отправьте свое резюме @veroneko, чтобы возглавить разработку системы дедупликации и Feature Store в R&D команде!

Описание вакансии

ID 2514

ML/DS-разработчик🔥 (дедупликация и feature store)

Senior

🌍 Локация: РФ, РБ (нет удаленки из др стран)

💼Сотрудничество : по ИП РФ , СМЗ РБ

Команда исследований и разработок (R&D) ищет программиста-исследователя в области Data Science.

Роль предполагает создание с нуля системы дедупликации клиентской базы и развитие инфраструктуры признаков.

Чем предстоит заниматься:

  • Проектировать и реализовывать систему дедупликации пользователей.
  • Формировать устойчивые векторы признаков для клиентского профиля.
  • Развивать feature store для использования в рекомендательных и прогностических моделях.
  • Контролировать качество данных и надежность ML-пайплайнов.

Технологический стек:

  • Python, SQL
  • Hive, PySpark
  • NumPy, Pandas, Scikit-learn, PyTorch, TensorFlow
  • Matplotlib, Seaborn
  • Ubuntu, Git

Будет преимуществом:

  • Опыт работы с медицинскими данными.
  • Профильное образование (физико-математические науки, Data Science,

медицинская кибернетика, биоинформатика).

🔎 Вопросы/резюме - в ЛС Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • SQL
  • Hive
  • PySpark
  • NumPy
  • Pandas
  • Scikit-learn
  • PyTorch
  • TensorFlow
  • Matplotlib
  • Seaborn
  • Ubuntu
  • Git

Возможные вопросы на собеседовании

Проверка архитектурных навыков в области работы с данными.

Как бы вы спроектировали систему дедупликации для базы данных из нескольких миллионов пользователей с учетом нечеткого поиска?

Оценка опыта работы с инфраструктурой признаков.

Какие ключевые компоненты Feature Store вы считаете критически важными для обеспечения консистентности данных между обучением и инференсом?

Проверка владения инструментами Big Data.

В каких случаях при обработке признаков вы предпочтете PySpark вместо Pandas, и как вы будете оптимизировать Spark-джойны?

Оценка понимания специфики данных.

Какие особенности медицинских данных (если есть опыт) или персональных данных клиентов необходимо учитывать при формировании векторов признаков?

Проверка навыков обеспечения качества.

Как вы организуете мониторинг качества данных и деградации моделей в ML-пайплайнах?

Похожие вакансии

TS
Top Selection
264 000 ₽ – 290 000 ₽

Senior MLOps инженер

SeniorУдалённо
MLOps · PyTorch · ClearML · ONNX · TensorRT · Triton Inference Server · Kubernetes · Helm · Kubeflow · Ray · KServe · vLLM · CI/CD · GPU Scheduling
+14 навыков
NDA
430 000 ₽ – 527 000 ₽

Senior MLOps инженер

SeniorУдалённо
Docker · Helm · Jenkins · GitLab CI · Python · Airflow · JupyterHub · MLflow · Seldon Core · CUDA · Kubernetes · Hadoop · Apache Spark · Apache Kafka · ELK stack
+15 навыков
AG
Aya Games
до 300 000 ₽

Senior Data Engineer

SeniorУдалённо
SQL · ClickHouse · Airflow · dbt · ETL · ELT · Data Engineering · OLAP · Monitoring
+9 навыков
NDA
160 000 ₽ – 220 000 ₽

Python разработчик (DWH/Data Engineering)

SeniorУдалённо
Python · SQL · PostgreSQL · ClickHouse · Apache Airflow · Kafka · Debezium · Docker · Kubernetes · Git · CI/CD · Apache Superset · Data Vault 2.0 · Apache Flink · Apache Spark
+15 навыков
NDA
1 900 ₽ – 2 000 ₽

Data Scientist Middle+, Senior

SeniorУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Machine Learning · Data Science · Feature Engineering · Spark MLlib · Pandas
+12 навыков
J
JETLYN
270 000 ₽ – 330 000 ₽

Data Scientist

SeniorУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Spark MLlib · Feature Engineering · Machine Learning · Time Series
+11 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

N
NDA
Россия