- Страна
- Россия
Откликайтесь
на вакансии с ИИ

ML/DevOps Engineer
МТС — сильный бренд с масштабными задачами. Вакансия предлагает работу с самым современным стеком (vllm, Triton, Qdrant), что гарантирует профессиональный рост в актуальной нише MLOps.
Сложность вакансии
Роль требует редкого сочетания навыков классического DevOps и глубокого понимания ML-инфраструктуры, включая работу с GPU, CUDA и специализированными серверами инференса. Высокая планка по безопасности и сложности пайплайнов повышает порог входа.
Анализ зарплаты
Зарплата в объявлении не указана, но для позиции MLOps-инженера в Москве в компаниях уровня МТС рыночные предложения обычно находятся в диапазоне от 300 000 до 500 000 рублей. Данная роль требует специфических знаний CUDA и Triton, что может поднять планку выше среднего по рынку DevOps.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в МТС уже сейчас
Присоединяйтесь к команде МТС и внедряйте передовые ML-решения в масштабах крупнейшей экосистемы!
Описание вакансии
ML/DevOps Engineer
Москва
Компания: МТС
*🔹*Технологический стек:
Docker, Linux, Kubernetes, Bash, GitLab CI, Ansible, Terraform, Airflow, Python, vllm, cuda, triton, Prometheus/Victoria Metrics, Grafana, SQL, Postgres, Elasticsearch, MLflow, Qdrant, Nexus, Vault
*🔹*Ты будешь:
-деплоить и интегрировать модели, сопутствующие сервисы и инструменты, автоматизировать поставку и оптимизировать потребление ресурсов
-мониторить и поддерживать работоспособность
-обеспечивать соответствие политикам информационной безопасности и стандартам надёжности при развёртывании ML‑решений
*🔹*Что для нас важно:
-уверенное администрирование Linux, понимание сетевых протоколов и потенциальных точек отказа
-опыт конфигурации и распределения мощностей видеокарт для обучения и инференса моделей
-опыт настройки мониторинга инфраструктуры и метрик деградации моделей
-опыт работы с vllm, Triton Inference Server, FastAPI, KServe или TorchServe
-опыт построения сложных многоэтапных пайплайнов с упором на безопасность
Контакты: Откликнуться
IT Jobs в Telegram | в VK | в Max
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Docker
- Linux
- Kubernetes
- Bash
- GitLab CI
- Ansible
- Terraform
- Airflow
- Python
- vLLM
- CUDA
- Triton Inference Server
- Prometheus
- VictoriaMetrics
- Grafana
- SQL
- PostgreSQL
- ElasticSearch
- MLflow
- Qdrant
- Nexus
- HashiCorp Vault
- FastAPI
- KServe
- TorchServe
Возможные вопросы на собеседовании
Проверка опыта оптимизации ресурсов при работе с тяжелыми моделями.
Расскажите о вашем опыте распределения мощностей GPU между несколькими ML-сервисами в Kubernetes. Как вы решаете проблему фрагментации памяти?
Оценка навыков работы со специализированным стеком инференса.
В чем основные преимущества использования Triton Inference Server по сравнению с обычным FastAPI-оберткой для деплоя моделей?
Проверка понимания специфики мониторинга ML-моделей.
Какие метрики, помимо стандартных (CPU/RAM), вы бы внедрили для отслеживания деградации качества модели в реальном времени?
Оценка навыков автоматизации и безопасности.
Как вы организуете безопасную передачу секретов и весов моделей в CI/CD пайплайнах с использованием Vault?
Проверка навыков работы с векторными БД.
Был ли у вас опыт масштабирования векторных баз данных, таких как Qdrant, и с какими сложностями вы сталкивались?
Похожие вакансии
Архитектор мультиагентных систем на базе LLM
Специалист по AI-инструментам
Fullstack разработчик-подмастерье (AI Engineer)
Fullstack / AI разработчик (подмастерье)
Applied AI / LLM Engineer (Python)
Аналитик AI-агентов Senior
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!