yandex
N
NDA
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorУдалённоПолная занятость

Senior Data Scientist (ID 3031)

ИИОценка ИИ

Длительный проект до 2026 года с возможностью удаленной работы из любой точки мира и серьезным техническим стеком делает вакансию очень привлекательной для опытных специалистов.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Позиция требует глубочайших знаний в математике (ТВиМС, предельные теоремы), алгоритмах и системной архитектуре, а также владения широким стеком инструментов (Spark, K8s, Airflow).

Анализ зарплаты

Медиана450 000 ₽
Рынок350 000 ₽ – 600 000 ₽
ИИОценка ИИ

В объявлении не указана зарплата, но для роли Senior Data Scientist с таким широким набором требований (MLOps, Spark, Math Stats) рыночные показатели в РФ и СНГ находятся в диапазоне 350-550 тысяч рублей.

Сопроводительное письмо

Меня заинтересовала вакансия Senior Data Scientist (ID 3031), так как мой опыт в разработке ML-архитектур и глубокое понимание математической статистики полностью соответствуют вашим требованиям. Я обладаю продвинутыми навыками в проведении A/B-тестов, использовании методов Causal Inference и оптимизации SQL-запросов в высоконагруженных системах.

В своей практике я не только строю SOTA-модели, но и уделяю большое внимание их жизненному циклу: от подготовки данных в Spark до деплоя в K8s и Airflow. Уверен, что мой опыт в рефакторинге техдолга и внедрении лучших практик разработки поможет вашей команде достичь поставленных бизнес-целей до 2026 года и далее.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Если вы готовы решать сложные задачи в области ML и влиять на архитектуру крупных систем, откликайтесь прямо сейчас!

Описание вакансии

ID 3031

Data Scientist

Senior

Кол-во специалистов

1

Длительность проекта

до 30.09.2026 (с пролонгацией)

Объем участия в проекте

Высокая нагрузка

~160 ч/мес

Формат взаимодействия

Удаленно

Требуемая локация специалиста

Любая

Доступность специалиста

по мск с 9 до 18, часовой пояс +-3 часа

Требуемое гражданство специалиста

любое

Обязательные требования

  • Умение оценивать сложность алгоритмов;
  • Знание алгоритмов и структур данных из стандартного курса;
  • Знание оценки сложности структур из стандартной библиотеки;
  • Знакомство с алгоритмами из расширенного набора: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах ТВиМС;
  • Предельные теоремы и умение их применять, проверка гипотез, бутстреп, A/B-тесты, условия сходимости, variance reduction, causal inference, байесовская оптимизация, графические модели, гауссовские процессы;
  • Понимание ML-алгоритмов, включая SOTA-методы (в своей области). Эффективно адаптировать их для решения задач при необходимости;
  • Строить модели из стандартных компонентов;
  • Понимать шаги жизненного цикла ML-разработки и их взаимодействие в проекте, разрабатывать архитектуру для продукта;
  • Понимать, какие бизнес-метрики для модели нужно мониторить;
  • Способность предложить прокси-метрики и функцию потерь, связанные с бизнес-метриками;
  • Умение докатить простую модель в пилот, имплементировать метод по статье, встроить компонент в существующий пайплайн;
  • Знаком с менее распространенными методами МО (например: байесовские модели/PGM/VBI, RL и прочее);
  • Умение выстраивать подход к прогнозированию, понимание ограничения методов, прокси-метрик и необходимости использования новых знаний SOTA в отдельных областях;
  • Умение разово зафиттить модель, по запросу проверить, жива ли она, обновить, развернуть какое-либо необходимое ПО в кластере, версионирование моделей данных, мониторинг работы моделей, качества данных;
  • Выстраивание инфраструктуры прогнозирования SQL;
  • Простые запросы (select'ы/группировки и т.д.);
  • Оптимизация запросов;
  • Понимание принципов Транзакций, Индексов, Ролей;
  • Переводить идеи в чистый код, который будут и исполнять, и читать;
  • Пользоваться git'ом;
  • Писать тесты;
  • Способен разбираться в чужом коде и эффективно его дебажить;
  • Способен разрабатывать архитектуру отдельных компонентов ПО с учетом простоты и поддерживаемости в хорошо очерченных сценариях;
  • Глубокое понимание всех компонентов архитектуры и стека;
  • Внедрение лучших практик разработки;
  • Понимание ограничений инструментов и необходимость создания новых, разбираться с масштабным тех-долгом и рефакторингом DB&BD
  • Промышленный опыт работы с несколькими системами;
  • Знание внутреннего устройства систем, используемых в работе, оптимизация вычислений/запросов, транзакции/ACID/Индексы, Other;
  • Имея на входе непонятную задачу, исследовать возможные решения и предлагать варианты.

Задачи на проекте

  • Разработка кода и тестов на python, участие в командной разработке, участие в код-ревью;
  • Разрабатывать архитектуру систем, использующих машинное обучение;
  • Подготовка данных для моделирования (получение, очистка);
  • Расчет результатов АБ-тестов, дизайн АБ-тестов;
  • Построение моделей машинного обучения;
  • Разворачивание моделей и сервисов в контуре (hadoop/k8s/airflow);
  • Написание запросов на SQL, оптимизация запросов (spark, в частности);
  • Предлагать идеи для улучшения модели/подхода;
  • Предлагать прокси-метрики и функции потерь, связанные с бизнес-метриками;
  • Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных;
  • Техническая реализация data-science решений на продуктах департамента;
  • Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных;
  • Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных

Этапы отбора

  1. Техническое интервью
  2. Интервью с ПО
+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • SQL
  • Machine Learning
  • A/B Testing
  • Causal Inference
  • Bayesian Optimization
  • Spark
  • Hadoop
  • Kubernetes
  • Airflow
  • Git
  • Algorithms
  • Data Structures
  • Statistics
  • Reinforcement Learning

Возможные вопросы на собеседовании

Проверка фундаментальных знаний статистики, необходимых для оценки качества моделей.

Расскажите, как вы применяете предельные теоремы и бутстреп для проверки гипотез в условиях малых выборок?

Вакансия требует умения работать с бизнес-метриками через прокси-метрики.

Приведите пример, когда оптимизация функции потерь напрямую не приводила к росту бизнес-метрики. Как вы решали эту проблему через прокси-метрики?

Упоминается работа с внешними алгоритмами и графами.

В каких сценариях вы бы предпочли использование графовых моделей или байесовской оптимизации вместо стандартных градиентных бустингов?

Проверка навыков инженерии и работы с данными в Big Data стеке.

Как вы подходите к оптимизации сложных Spark-запросов при работе с терабайтными данными и перекосами (data skew)?

Senior-роль предполагает ответственность за архитектуру.

Опишите ваш подход к проектированию системы мониторинга качества данных и дрейфа моделей в продакшене.

Похожие вакансии

более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

N
NDA