- Страна
- Россия
Откликайтесь
на вакансии с ИИ

Senior/middle ML researcher (audio) в Рекомендации
Исключительная вакансия для ML-исследователей: работа с передовым стеком (H100), возможность публикаций в топовых конференциях и сильное комьюнити (ШАД, МФТИ). Высокий балл за ресурсы и потенциал профессионального роста.
Сложность вакансии
Высокая сложность обусловлена необходимостью глубоких знаний в Deep Learning и специфике аудио-данных, а также умением работать с масштабными GPU-кластерами и научными публикациями. Требуется сильная математическая база и опыт доведения R&D проектов до продакшена.
Анализ зарплаты
Для позиций уровня Middle/Senior ML Researcher в Москве рыночные вилки составляют от 300 000 до 600 000 рублей. Учитывая масштаб VK и сложность задач (Audio, Foundation Models), можно ожидать предложение в верхней части этого диапазона плюс значительные годовые бонусы.
Сопроводительное письмо
Я заинтересован в позиции Senior/Middle ML Researcher (Audio) в команде рекомендаций AI VK. Мой опыт в области Deep Learning и работы с PyTorch, а также интерес к разработке foundation-моделей для аудио, полностью соответствуют задачам вашей группы. Меня впечатляет масштаб ресурсов VK, включая кластеры с A100/H100, и возможность публикации статей уровня A*/A под руководством ведущих экспертов.
В своей практике я не только занимался обучением моделей, но и доводил их до внедрения в продакшн, что требует глубокого понимания как алгоритмической части, так и инфраструктурных решений вроде k8s и Triton. Работа с аудио-языковыми моделями и контентными эмбеддерами — это именно то направление, в котором я хочу развиваться профессионально.
Буду рад обсудить, как мой опыт в воспроизведении SOTA-решений и проектировании пайплайнов обработки данных поможет вашей команде в развитии аудио-модальности для рекомендательных систем VK.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в vk уже сейчас
Присоединяйтесь к команде VK и создавайте аудио-модели нового поколения — пишите Артему прямо сейчас!
Описание вакансии
Всем привет!
Mы - группа модальности аудио в составе отдела экспериментальных технологий в направлении рекомендаций AI VK. Ищем сильного ML инженера-исследователя, заинтересованного в работе с аудио данными.
Вакансия: Senior/middle ML researcher (audio) в Рекомендации
В фокусе нашей группы - развитие аудио-модальности для задач рекомендаций и не только. Одна из основных задач - разработка foundation аудио-моделей. В настоящее время мы разрабатываем аудио-языковые модели, а также различные контентные эмбеддеры и классификаторы.
Задачи
- Исследовать и воспроизводить последние научные достижения (SOTA) в области ML для аудио;
- С нуля проектировать, обучать и оценивать большие аудио-модели на масштабных данных;
- Разрабатывать контентные аудио модели для работы в различных доменах VK;
- Готовить данные, строить пайплайны, проводить эксперименты, анализировать результаты;
- Доводить успешные эксперименты до пилота и внедрения в продукт совместно с продуктовыми командами;
- Делиться результатами через публикации и выступления.
Технологии
- Стандартный ML-стек: python3 + PyTorch.
- Хранение и обработка данных: YTsaurus, s3, k8s
- Удаленная разработка и запуск экспериментов на кластере с GPU (сотни a100 и h100).
Рост
На регулярных 1-1 мы фокусируемся на профессиональном росте и стремимся, чтобы каждый занимался тем, что ему интересно. Мы активно принимаем участие в конференциях и готовим статьи уровня A\*/A (совместно с отделом исследований, которым руководит Александр Дьяконов).
Требования
- Практический опыт работы в DL;
- Уверенное знание Python и PyTorch;
- Опыт оптимизации и внедрения моделей в продакшн;
- Знание классических алгоритмов и структур данных.
Будет плюсом
- Подтвержденный опыт работы с аудио данными;
- Опыт чтения и воспроизведения алгоритмов из научных статей;
- Опыт работы с YTsaurus, k8s и Triton Inference Server;
- Знание SQL;
- Опыт построения рекомендательных систем.
Условия
- Конкурентная заработная плата;
- Гибкий график работы;
- Профессиональная команда с большой долей выпускников ШАД, МФТИ, ФКН и других топовых вузов;
- Комфортный офис в центре города (БЦ Аврора);
- ДМС;
- Бонусы и скидки от партнёров VK;
По вопросам и откликам — пишите Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- PyTorch
- Deep Learning
- Machine Learning
- SQL
- Kubernetes
- Triton Inference Server
- YTsaurus
- S3
- Audio Processing
Возможные вопросы на собеседовании
Проверка фундаментальных знаний в обработке сигналов, необходимых для работы с аудио.
Расскажите о различиях между STFT, мел-спектрограммами и MFCC. В каких случаях вы бы выбрали каждый из этих признаков для обучения модели?
Оценка опыта работы с современными архитектурами, упомянутыми в вакансии.
Какие подходы к созданию Audio Foundation Models вы считаете наиболее перспективными (например, AudioMAE, Wav2Vec 2.0, CLAP)? С какими сложностями вы сталкивались при их обучении?
Проверка навыков работы с большими данными и оптимизации.
Как бы вы организовали эффективный пайплайн загрузки и аугментации аудио-данных для обучения на кластере с сотнями GPU, чтобы избежать простоя вычислительных мощностей?
Оценка продуктового мышления и понимания рекомендательных систем.
Как можно использовать аудио-эмбеддинги для решения проблемы холодного старта в рекомендациях музыки или подкастов?
Проверка навыков работы с инфраструктурой.
Был ли у вас опыт деплоя тяжелых аудио-моделей через Triton Inference Server? Как вы подходите к вопросу оптимизации задержки (latency) при инференсе?
Похожие вакансии
MLOps Engineer (ML pipelines / Kubernetes / Airflow)
Senior Data инженер
Senior MLOps Engineer (Platform Development / LLMOps)
Data Engineer / SAP HANA Developer (Senior)
Senior ML Engineer
Senior MLOps
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Россия