- Страна
- Россия
Откликайтесь
на вакансии с ИИ

DevOps - MLOps
Интересная вакансия на стыке DevOps и AI с современным стеком технологий. Ограничением является работа только через ИП и отсутствие указанной вилки зарплаты, но технологический вызов очень достойный.
Сложность вакансии
Роль требует редкого сочетания навыков классического DevOps и специфических знаний MLOps, включая работу с GPU в Kubernetes и LLM-инференсом. Высокая сложность обусловлена широким стеком технологий от Big Data до информационной безопасности.
Анализ зарплаты
Для позиций Middle+/Senior DevOps с уклоном в MLOps на российском рынке средние зарплаты составляют 350,000–500,000 рублей. Учитывая требование работы через ИП, кандидат может рассчитывать на верхнюю границу рынка из-за экономии компании на налогах.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Отправьте резюме @maksimm2108, чтобы стать ключевым инженером в современной MLOps экосистеме!
Описание вакансии
#vacancy #Вакансия #fintech #remote
DevOps - MLOps
грейд: middle/senior
Работа ТОЛЬКО через ИП.
локация: РФ
Требования:
• Языки: Python, Java, Bash.
• Оркестрация и CI/CD: Kubernetes (k8s), GitLab CI/CD, Helm.
• Базы данных и Big Data: PostgreSQL, ClickHouse, Hadoop, Trino, Airflow, Redis.
• Observability: Grafana, Prometheus, OpenSearch.
• ML & AI Infrastructure: vLLM, LightLLM, GPU-ноды.
• Безопасность: Keycloak, OAuth2, HashiCorp Vault.
Чем предстоит заниматься:
• Администрирование ML-инфраструктуры: Поддержка и масштабирование Kubernetes-кластеров с GPU-нодами, развертывание и оптимизация сервисов инференса (vLLM, LightLLM).
• Развитие CI/CD: Проектирование и улучшение пайплайнов в GitLab CI/CD, ускорение сборок.
• Автоматизация рутины: Замена ручных операций на автоматизированные сценарии, разработка ботов и агентов для поддержки команды.
• MLOps: Автоматизация жизненного цикла ML-моделей: от обучения и тестирования до деплоя и мониторинга дрейфа данных.
• Observability: Настройка комплексного логирования, мониторинга и алертинга (Prometheus, Grafana, OpenSearch) для всех компонентов системы.
• Поддержка инфраструктуры: Администрирование серверов команды, обеспечение отказоустойчивости и безопасности.
• Интеграция агентских систем: Участие в разработке, интеграции и деплое автономных агентных систем и LLM-приложений.
Что мы ожидаем:
• Опыт коммерческой администрирования Linux и управления производственными кластерами Kubernetes.
• Уверенное владение Helm (написание чартов, управление релизами).
• Продвинутый опыт построения и поддержки пайплайнов CI/CD (GitLab CI/CD или аналоги).
• Понимание принципов безопасности: опыт работы с Keycloak/OAuth2, управление секретами через Vault.
• Глубокие знания в области Observability: стек Prometheus/Grafana, OpenSearch.
• Навыки написания скриптов для автоматизации (Python, Bash).
Будет круто, если вы:
• Имеете опыт поддержки и администрирования Big Data-сервисов: Trino, Airflow, ClickHouse, Kafka, Hadoop, Redis.
• Разрабатывали внутренний тулинг и утилиты на Python.
• Сталкивались с задачей оптимизации работы GPU в Kubernetes (device plugins, мониторинг VRAM, планирование задач).
• Знаете принципы работы LLM и фреймворков для их обслуживания
писать в директ Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- Java
- Bash
- Kubernetes
- GitLab CI/CD
- Helm
- PostgreSQL
- ClickHouse
- Hadoop
- Trino
- Airflow
- Redis
- Grafana
- Prometheus
- OpenSearch
- vLLM
- LightLLM
- GPU
- Keycloak
- OAuth2
- HashiCorp Vault
- Kafka
Возможные вопросы на собеседовании
Проверка практического опыта работы с ML-специфичной инфраструктурой.
Расскажите о вашем опыте проброса и мониторинга GPU в Kubernetes. С какими проблемами планирования ресурсов вы сталкивались?
Оценка навыков автоматизации жизненного цикла моделей.
Как бы вы организовали процесс CI/CD для LLM-приложения, учитывая необходимость тестирования качества ответов модели?
Проверка владения инструментами безопасности.
Каким образом вы организуете динамическое управление секретами в Kubernetes с использованием HashiCorp Vault?
Оценка опыта работы с высоконагруженными системами хранения.
В чем заключаются основные сложности администрирования и масштабирования ClickHouse и Trino в контейнеризированной среде?
Проверка навыков мониторинга.
Какие специфические метрики вы бы вывели на дашборд Grafana для мониторинга здоровья vLLM сервиса?
Похожие вакансии
Senior DevOps
SRE инженер
Инженер по гибридной инфраструктуре (импортозамещение + облака)
DevOps / DevSecOps Engineer
Devops Middle+/Senior
Senior DevOps/MLOps
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Россия