- Страна
- Россия
Откликайтесь
на вакансии с ИИ

ML Platform Engineer
Вакансия в крупной стабильной компании с четко обозначенным современным стеком технологий. Проект по созданию внутренней AI-платформы обещает интересные инженерные вызовы и работу с передовыми решениями (LLM, агенты).
Сложность вакансии
Роль требует глубоких знаний как в классическом программном обеспечении (Python, FastAPI, SQL), так и в специфических MLOps инструментах (Kubernetes, Airflow, Triton). Высокий порог входа обусловлен необходимостью понимания архитектуры LLM и опыта работы с высоконагруженными продакшен-системами.
Анализ зарплаты
Зарплата в объявлении не указана, но для позиции ML Platform Engineer уровня Senior в России рыночный диапазон составляет от 300 000 до 500 000 рублей. РОСГОССТРАХ обычно предлагает конкурентоспособные условия, соответствующие средним и верхним границам рынка для опытных специалистов.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Росгосстрах уже сейчас
Присоединяйтесь к команде РОСГОССТРАХ и создавайте будущее страховых технологий на базе AI!
Описание вакансии
ML Platform Engineer
Локация: Удалённо
Компания: РОСГОССТРАХ
ЗП: обсуждается на собеседовании
Занятость: Полная
Росгосстрах сейчас активно развивает внутреннюю платформу - экосистему AI-сервисов для автоматизации ключевых процессов компании. Для этого формируем новую команду, которая будет фокусироваться на улучшении ключевых метрик новых моделей, минимизацию временных затрат на их разработку и выведению в промышленную эксплуатацию.
Что предстоит:
Работа с уже существующими ML-моделями: встраивание в бизнес-процессы, масштабирование и вывод в продакшен;
Настройка и поддержка пайплайнов и сервисов для batch- и online-инференса;
Разработка и отладка DAG-ов в Airflow;
Контейнеризация сервисов и эксплуатация моделей в Kubernetes;
Разработка и поддержка API на FastAPI для интеграции моделей;
Обеспечение стабильной работы ML-сервисов в продакшене;
Версионирование моделей и управление артефактами;
Оптимизация инференса и контроль использования ресурсов;
Участие в развитии инфраструктуры полного жизненного цикла ML-моделей.
Для нас важно:
Опыт работы в области MLOps/ML-engineer от 3 лет;
Понимание ML-алгоритмов и жизненного цикла модели:
от постановки задачи, экспериментов и версионирования до деплоя и мониторинга в продакшене;
знаете, как работают бустинги;
чем трансформеры (LLM) отличаются от классических сетей;
знаете, что такое эмбеддинги и для чего они применяются.
Python и FastAPI:
уверенное владение асинхронным/многопоточным программированием (asyncio, threading, multiprocessing);
ООП с принципами SOLID;
проектирование поддерживаемых, документированных и высоконагруженных API;
Работа с SQLAlchemy, асинхронными драйверами базы данных.
Airflow: разработка и отладка DAG-ов для batch-инференса моделей;
Контейнеризация и оркестрация: работа с Docker и Kubernetes — опыт эксплуатации production-кластеров, настройка лимитов;
Работа с базами данных: SQL, NoSQL - владение реляционными БД для хранения структурированных данных.
Является преимуществом:
KServe / Seldon / TorchServe — опыт развертывания моделей на inference-платформах.
Triton Inference Server — оптимизация инференса, динамическое батчирование, работа с разными бекендами (TensorRT, ONNX).
опыт инференса больших языковых моделей (vLLM, llama), оптимизация GPU-памяти, continuous batching.
Агенты: опыт проектирования агентных систем, работа с LangChain, LlamaIndex, LangGraph
Real-time системы: Kafka, RabbitMQ, streaming-инференс, Faust.
*🌐 Резюме отправлять:* Откликнуться
–––
Бесплатный постинг вакансий: @freeIT_job
Забирай *📚* Базу Знаний
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- PyTorch
- LLM
- SQL
- Kubernetes
- MLOps
- Docker
- Airflow
- Kafka
- NoSQL
- FastAPI
- LangChain
- SQLAlchemy
- RabbitMQ
- TensorRT
- Triton Inference Server
- ONNX
Возможные вопросы на собеседовании
Проверка понимания специфики работы с GPU и оптимизации инференса для тяжелых моделей.
Какие стратегии оптимизации инференса LLM вы использовали (например, квантование, continuous batching) и как это влияло на задержку (latency)?
Оценка навыков проектирования отказоустойчивых систем.
Как вы организуете мониторинг и обработку ошибок в Airflow DAG при выполнении критических batch-задач инференса?
Проверка опыта работы с Kubernetes в контексте ML.
С какими проблемами вы сталкивались при масштабировании ML-сервисов в Kubernetes и как настраивали лимиты ресурсов для GPU-зависимых контейнеров?
Проверка фундаментальных знаний Python.
В каких случаях в FastAPI приложении вы предпочтете использование multiprocessing вместо asyncio для обработки входящих данных перед инференсом?
Оценка понимания жизненного цикла моделей.
Как вы организуете версионирование моделей и данных, чтобы обеспечить воспроизводимость результатов в продакшене?
Похожие вакансии
Middle+ Data инженер
Junior Applied ML Engineer / Data Scientist
Backend / ML Infrastructure / MLOps инженер
Data Engineer (AI / ML)
Data Scientist (Junior+)
Backend / ML Infrastructure / MLOps инженер (ИИ-ассистент)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!