- Страна
- Россия
- Зарплата
- 264 000 ₽ – 290 000 ₽
Откликайтесь
на вакансии с ИИ

Senior MLOps инженер
Привлекательная вакансия для опытных специалистов с четким стеком технологий и долгосрочными перспективами. Однако ограничение по оформлению (только ИП) и отсутствие указания конкретной продуктовой области могут быть минусом для некоторых кандидатов.
Сложность вакансии
Роль требует глубокой экспертизы в специфическом стеке (ClearML, Triton, TensorRT) и навыков низкоуровневой оптимизации моделей (квантование). Высокий грейд Senior подразумевает самостоятельность в настройке GPU-кластеров и CI/CD для ML.
Анализ зарплаты
Предложенная ставка (264-290к) находится на уровне или чуть ниже среднего рыночного диапазона для Senior MLOps в РФ, где опытные специалисты часто претендуют на суммы от 350к до 500к рублей. Однако для проектной занятости с оплатой по часам или фиксированной ставке это может быть конкурентным предложением в зависимости от сложности задач.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Top Selection уже сейчас
Присоединяйтесь к Top Selection в качестве Senior MLOps инженера и создавайте передовую ML-инфраструктуру на долгосрочном проекте!
Описание вакансии
#MLOpsвакансия #вакансияMLOps #MLOpsинженер #вакансия
Senior MLOps ❇️ | Компания Top Selection
🔥 Мы в поиске MLOps инженера проектную занятость
Грейд: Senior
Ставка: от 264К до 290К
Гражданство/Локация: РФ
Загрузка: фуллтайм
Срок: долгосрочный
Оформление: только ИП 📌 (не СЗ, не ТК)
✔️Основные требования
Практический опыт построения MLOps-процессов для проектов с использованием нейронных сетей.
Опыт работы с PyTorch.
Опыт автоматизации обучения моделей с использованием ClearML, ClearML SDK, ClearML Agent.
Опыт конвертации моделей в ONNX.
Практический опыт оптимизации инференса с использованием TensorRT.
Понимание и опыт применения методов квантования моделей (FP16, INT8, FP8).
Опыт развертывания и сопровождения сервисов инференса с использованием Triton Inference Server, ClearML Serving или аналогичных решений (например, BentoML).
Опыт работы с vLLM для обслуживания LLM-моделей будет преимуществом.
Опыт работы с Kubernetes и Helm.
Практический опыт управления GPU-ресурсами и организации GPU scheduling.
Опыт работы с инструментами оркестрации ML-задач, такими как Kubeflow, Ray, KServe.
➕Будет плюсом
Опыт эксплуатации ML-инфраструктуры как в облачных средах, так и On-Prem.
Опыт оптимизации производительности GPU и инференса крупных моделей.
Понимание современных практик CI/CD для ML (MLOps).
📌Основные задачи
Разработка и поддержка MLOps-инфраструктуры для обучения, развертывания и сопровождения моделей машинного обучения.
Автоматизация процессов обучения нейронных сетей, управления экспериментами и пайплайнами обучения.
Подготовка и оптимизация моделей для промышленного инференса.
Развертывание и сопровождение сервисов инференса в облачной и On-Prem инфраструктуре.
Настройка и сопровождение GPU-кластеров, обеспечение эффективного использования вычислительных ресурсов.
Внедрение и поддержка CI/CD-процессов для ML-моделей.
Взаимодействие с Data Science-командой для внедрения моделей в промышленную эксплуатацию.
Мониторинг производительности моделей и инфраструктуры, оптимизация времени обучения и инференса.
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- MLOps
- PyTorch
- ClearML
- ONNX
- TensorRT
- Triton Inference Server
- Kubernetes
- Helm
- Kubeflow
- Ray
- KServe
- vLLM
- CI/CD
- GPU Scheduling
Возможные вопросы на собеседовании
Проверка практического опыта работы с основным инструментом автоматизации, указанным в вакансии.
Расскажите о вашем опыте настройки ClearML Agent и организации очередей задач для обучения моделей на GPU-кластере.
Вакансия требует навыков оптимизации инференса.
Какие основные сложности возникают при конвертации PyTorch моделей в ONNX и последующей оптимизации через TensorRT, и как вы их решали?
Важный аспект для Senior-позиции — понимание эффективности вычислений.
В каких случаях вы бы предпочли квантование INT8 вместо FP16, и как это влияет на точность модели и пропускную способность Triton Inference Server?
Проверка навыков инфраструктурного инженера в контексте ML.
Как вы организуете мониторинг использования GPU-ресурсов в Kubernetes и какие стратегии scheduling используете для предотвращения фрагментации памяти?
Оценка опыта работы с современными LLM-фреймворками.
Каков ваш опыт работы с vLLM? Какие преимущества это дает по сравнению со стандартными решениями для обслуживания больших языковых моделей?
Похожие вакансии
Senior Data Engineer
Python разработчик (DWH/Data Engineering)
Data Scientist Middle+, Senior
Data Scientist
ML-инженер
Middle+ Data инженер
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!