Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

В офисеПолная занятость

ML/DevOps Engineer

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

МТС — сильный бренд с масштабными задачами. Вакансия предлагает работу с самым современным стеком (vllm, Triton, Qdrant), что гарантирует профессиональный рост в актуальной нише MLOps.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует редкого сочетания навыков классического DevOps и глубокого понимания ML-инфраструктуры, включая работу с GPU, CUDA и специализированными серверами инференса. Высокая планка по безопасности и сложности пайплайнов повышает порог входа.

Анализ зарплаты

Медиана400 000 ₽

Рынок300 000 ₽ – 550 000 ₽

Зарплата в объявлении не указана, но для позиции MLOps-инженера в Москве в компаниях уровня МТС рыночные предложения обычно находятся в диапазоне от 300 000 до 500 000 рублей. Данная роль требует специфических знаний CUDA и Triton, что может поднять планку выше среднего по рынку DevOps.

Меня заинтересовала вакансия ML/DevOps инженера в МТС, так как мой опыт объединяет классическое администрирование инфраструктуры и специфические задачи машинного обучения. Я обладаю глубокими знаниями Linux и Kubernetes, а также имею практический опыт работы с vllm и Triton Inference Server, что критично для эффективного инференса современных моделей.

В своей работе я уделяю особое внимание автоматизации через GitLab CI и Ansible, а также обеспечению безопасности пайплайнов. Уверен, что мои навыки настройки мониторинга на базе Prometheus и Grafana помогут обеспечить высокую надежность ML-сервисов вашей компании. Буду рад обсудить, как мой опыт работы с GPU-мощностями и векторными базами данных (Qdrant) может быть полезен вашей команде.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в МТС уже сейчас

Присоединяйтесь к команде МТС и внедряйте передовые ML-решения в масштабах крупнейшей экосистемы!

Описание вакансии

ML/DevOps Engineer

#офис

Москва

Компания: МТС

*🔹*Технологический стек:

Docker, Linux, Kubernetes, Bash, GitLab CI, Ansible, Terraform, Airflow, Python, vllm, cuda, triton, Prometheus/Victoria Metrics, Grafana, SQL, Postgres, Elasticsearch, MLflow, Qdrant, Nexus, Vault

*🔹*Ты будешь:

-деплоить и интегрировать модели, сопутствующие сервисы и инструменты, автоматизировать поставку и оптимизировать потребление ресурсов

-мониторить и поддерживать работоспособность

-обеспечивать соответствие политикам информационной безопасности и стандартам надёжности при развёртывании ML‑решений

*🔹*Что для нас важно:

-уверенное администрирование Linux, понимание сетевых протоколов и потенциальных точек отказа

-опыт конфигурации и распределения мощностей видеокарт для обучения и инференса моделей

-опыт настройки мониторинга инфраструктуры и метрик деградации моделей

-опыт работы с vllm, Triton Inference Server, FastAPI, KServe или TorchServe

-опыт построения сложных многоэтапных пайплайнов с упором на безопасность

Контакты: Откликнуться

IT Jobs в Telegram | в VK | в Max

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Docker
Linux
Kubernetes
Bash
GitLab CI
Ansible
Terraform
Airflow
Python
vLLM
CUDA
Triton Inference Server
Prometheus
VictoriaMetrics
Grafana
SQL
PostgreSQL
ElasticSearch
MLflow
Qdrant
Nexus
HashiCorp Vault
FastAPI
KServe
TorchServe

Возможные вопросы на собеседовании

Проверка опыта оптимизации ресурсов при работе с тяжелыми моделями.

Расскажите о вашем опыте распределения мощностей GPU между несколькими ML-сервисами в Kubernetes. Как вы решаете проблему фрагментации памяти?

Оценка навыков работы со специализированным стеком инференса.

В чем основные преимущества использования Triton Inference Server по сравнению с обычным FastAPI-оберткой для деплоя моделей?

Проверка понимания специфики мониторинга ML-моделей.

Какие метрики, помимо стандартных (CPU/RAM), вы бы внедрили для отслеживания деградации качества модели в реальном времени?

Оценка навыков автоматизации и безопасности.

Как вы организуете безопасную передачу секретов и весов моделей в CI/CD пайплайнах с использованием Vault?

Проверка навыков работы с векторными БД.

Был ли у вас опыт масштабирования векторных баз данных, таких как Qdrant, и с какими сложностями вы сталкивались?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

ML/DevOps Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в МТС уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте распределения мощностей GPU между несколькими ML-сервисами в Kubernetes. Как вы решаете проблему фрагментации памяти?

В чем основные преимущества использования Triton Inference Server по сравнению с обычным FastAPI-оберткой для деплоя моделей?

Какие метрики, помимо стандартных (CPU/RAM), вы бы внедрили для отслеживания деградации качества модели в реальном времени?

Как вы организуете безопасную передачу секретов и весов моделей в CI/CD пайплайнах с использованием Vault?

Был ли у вас опыт масштабирования векторных баз данных, таких как Qdrant, и с какими сложностями вы сталкивались?

Похожие вакансии

Архитектор мультиагентных систем на базе LLM

Специалист по AI-инструментам

Fullstack разработчик-подмастерье (AI Engineer)

Fullstack / AI разработчик (подмастерье)

Applied AI / LLM Engineer (Python)

Аналитик AI-агентов Senior

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

ML/DevOps Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в МТС уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте распределения мощностей GPU между несколькими ML-сервисами в Kubernetes. Как вы решаете проблему фрагментации памяти?

В чем основные преимущества использования Triton Inference Server по сравнению с обычным FastAPI-оберткой для деплоя моделей?

Какие метрики, помимо стандартных (CPU/RAM), вы бы внедрили для отслеживания деградации качества модели в реальном времени?

Как вы организуете безопасную передачу секретов и весов моделей в CI/CD пайплайнах с использованием Vault?

Был ли у вас опыт масштабирования векторных баз данных, таких как Qdrant, и с какими сложностями вы сталкивались?

Похожие вакансии

Архитектор мультиагентных систем на базе LLM

Специалист по AI-инструментам

Fullstack разработчик-подмастерье (AI Engineer)

Fullstack / AI разработчик (подмастерье)

Applied AI / LLM Engineer (Python)

Аналитик AI-агентов Senior

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ