Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

УдалённоПолная занятость

ML Platform Engineer

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Вакансия в крупной стабильной компании с четко обозначенным современным стеком технологий. Проект по созданию внутренней AI-платформы обещает интересные инженерные вызовы и работу с передовыми решениями (LLM, агенты).

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует глубоких знаний как в классическом программном обеспечении (Python, FastAPI, SQL), так и в специфических MLOps инструментах (Kubernetes, Airflow, Triton). Высокий порог входа обусловлен необходимостью понимания архитектуры LLM и опыта работы с высоконагруженными продакшен-системами.

Анализ зарплаты

Медиана400 000 ₽

Рынок300 000 ₽ – 550 000 ₽

Зарплата в объявлении не указана, но для позиции ML Platform Engineer уровня Senior в России рыночный диапазон составляет от 300 000 до 500 000 рублей. РОСГОССТРАХ обычно предлагает конкурентоспособные условия, соответствующие средним и верхним границам рынка для опытных специалистов.

Меня заинтересовала вакансия ML Platform Engineer в РОСГОССТРАХ, так как мой опыт в MLOps и разработке высоконагруженных систем на Python полностью соответствует вашим задачам. Я имею глубокую экспертизу в контейнеризации моделей через Kubernetes, разработке сложных DAG в Airflow и проектировании API на FastAPI. Особенно меня привлекает возможность участвовать в создании экосистемы AI-сервисов с нуля и работать с современным стеком, включая LLM и Triton Inference Server.

На предыдущих проектах я успешно выводил ML-модели в промышленную эксплуатацию, обеспечивая стабильный batch- и online-инференс. Я знаком с принципами SOLID и асинхронным программированием, что позволяет мне создавать поддерживаемый и масштабируемый код. Уверен, что мои навыки в оптимизации ресурсов и управлении жизненным циклом моделей помогут вашей команде минимизировать Time-to-Market для новых AI-решений.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Росгосстрах уже сейчас

Присоединяйтесь к команде РОСГОССТРАХ и создавайте будущее страховых технологий на базе AI!

Описание вакансии

ML Platform Engineer

Локация: Удалённо

Компания: РОСГОССТРАХ

ЗП: обсуждается на собеседовании

Занятость: Полная

Росгосстрах сейчас активно развивает внутреннюю платформу - экосистему AI-сервисов для автоматизации ключевых процессов компании. Для этого формируем новую команду, которая будет фокусироваться на улучшении ключевых метрик новых моделей, минимизацию временных затрат на их разработку и выведению в промышленную эксплуатацию.

Что предстоит:

Работа с уже существующими ML-моделями: встраивание в бизнес-процессы, масштабирование и вывод в продакшен;

Настройка и поддержка пайплайнов и сервисов для batch- и online-инференса;

Разработка и отладка DAG-ов в Airflow;

Контейнеризация сервисов и эксплуатация моделей в Kubernetes;

Разработка и поддержка API на FastAPI для интеграции моделей;

Обеспечение стабильной работы ML-сервисов в продакшене;

Версионирование моделей и управление артефактами;

Оптимизация инференса и контроль использования ресурсов;

Участие в развитии инфраструктуры полного жизненного цикла ML-моделей.

Для нас важно:

Опыт работы в области MLOps/ML-engineer от 3 лет;

Понимание ML-алгоритмов и жизненного цикла модели:

от постановки задачи, экспериментов и версионирования до деплоя и мониторинга в продакшене;

знаете, как работают бустинги;

чем трансформеры (LLM) отличаются от классических сетей;

знаете, что такое эмбеддинги и для чего они применяются.

Python и FastAPI:

уверенное владение асинхронным/многопоточным программированием (asyncio, threading, multiprocessing);

ООП с принципами SOLID;

проектирование поддерживаемых, документированных и высоконагруженных API;

Работа с SQLAlchemy, асинхронными драйверами базы данных.

Airflow: разработка и отладка DAG-ов для batch-инференса моделей;

Контейнеризация и оркестрация: работа с Docker и Kubernetes — опыт эксплуатации production-кластеров, настройка лимитов;

Работа с базами данных: SQL, NoSQL - владение реляционными БД для хранения структурированных данных.

Является преимуществом:

KServe / Seldon / TorchServe — опыт развертывания моделей на inference-платформах.

Triton Inference Server — оптимизация инференса, динамическое батчирование, работа с разными бекендами (TensorRT, ONNX).

опыт инференса больших языковых моделей (vLLM, llama), оптимизация GPU-памяти, continuous batching.

Агенты: опыт проектирования агентных систем, работа с LangChain, LlamaIndex, LangGraph

Real-time системы: Kafka, RabbitMQ, streaming-инференс, Faust.

*🌐 Резюме отправлять:* Откликнуться

–––

Бесплатный постинг вакансий: @freeIT_job

Забирай *📚* Базу Знаний

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
PyTorch
LLM
SQL
Kubernetes
MLOps
Docker
Airflow
Kafka
NoSQL
FastAPI
LangChain
SQLAlchemy
RabbitMQ
TensorRT
Triton Inference Server
ONNX

Возможные вопросы на собеседовании

Проверка понимания специфики работы с GPU и оптимизации инференса для тяжелых моделей.

Какие стратегии оптимизации инференса LLM вы использовали (например, квантование, continuous batching) и как это влияло на задержку (latency)?

Оценка навыков проектирования отказоустойчивых систем.

Как вы организуете мониторинг и обработку ошибок в Airflow DAG при выполнении критических batch-задач инференса?

Проверка опыта работы с Kubernetes в контексте ML.

С какими проблемами вы сталкивались при масштабировании ML-сервисов в Kubernetes и как настраивали лимиты ресурсов для GPU-зависимых контейнеров?

Проверка фундаментальных знаний Python.

В каких случаях в FastAPI приложении вы предпочтете использование multiprocessing вместо asyncio для обработки входящих данных перед инференсом?

Оценка понимания жизненного цикла моделей.

Как вы организуете версионирование моделей и данных, чтобы обеспечить воспроизводимость результатов в продакшене?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

ML Platform Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Росгосстрах уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие стратегии оптимизации инференса LLM вы использовали (например, квантование, continuous batching) и как это влияло на задержку (latency)?

Как вы организуете мониторинг и обработку ошибок в Airflow DAG при выполнении критических batch-задач инференса?

С какими проблемами вы сталкивались при масштабировании ML-сервисов в Kubernetes и как настраивали лимиты ресурсов для GPU-зависимых контейнеров?

В каких случаях в FastAPI приложении вы предпочтете использование multiprocessing вместо asyncio для обработки входящих данных перед инференсом?

Как вы организуете версионирование моделей и данных, чтобы обеспечить воспроизводимость результатов в продакшене?

Похожие вакансии

Middle+ Data инженер

Junior Applied ML Engineer / Data Scientist

Backend / ML Infrastructure / MLOps инженер

Data Engineer (AI / ML)

Data Scientist (Junior+)

Backend / ML Infrastructure / MLOps инженер (ИИ-ассистент)

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

ML Platform Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Росгосстрах уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие стратегии оптимизации инференса LLM вы использовали (например, квантование, continuous batching) и как это влияло на задержку (latency)?

Как вы организуете мониторинг и обработку ошибок в Airflow DAG при выполнении критических batch-задач инференса?

С какими проблемами вы сталкивались при масштабировании ML-сервисов в Kubernetes и как настраивали лимиты ресурсов для GPU-зависимых контейнеров?

В каких случаях в FastAPI приложении вы предпочтете использование multiprocessing вместо asyncio для обработки входящих данных перед инференсом?

Как вы организуете версионирование моделей и данных, чтобы обеспечить воспроизводимость результатов в продакшене?

Похожие вакансии

Middle+ Data инженер

Junior Applied ML Engineer / Data Scientist

Backend / ML Infrastructure / MLOps инженер

Data Engineer (AI / ML)

Data Scientist (Junior+)

Backend / ML Infrastructure / MLOps инженер (ИИ-ассистент)

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ