- Страна
- Россия
- Зарплата
- 180 000 ₽ – 250 000 ₽
Откликайтесь
на вакансии с ИИ

Backend / ML Infrastructure / MLOps инженер
Интересный проект на острие технологий (LLM, RAG) с понятной бизнес-задачей. Хорошая вилка для Middle-уровня и возможность удаленной работы, однако проектный характер занятости на старте может быть минусом для некоторых кандидатов.
Сложность вакансии
Позиция требует уверенного владения Python и понимания специфики работы с LLM и векторными БД. Основная сложность заключается в необходимости доработки существующей инфраструктуры и обеспечения стабильности self-host инференса.
Анализ зарплаты
Предложенная зарплата (180-250к на руки) полностью соответствует рыночным ожиданиям для Middle Python/MLOps инженера в РФ. Верхняя граница даже немного превышает медиану для специалистов среднего уровня в образовательном секторе.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в ООО «Образовательные продукты Русяева» уже сейчас
Присоединяйтесь к созданию инновационного ИИ-ассистента для юристов и реализуйте свой потенциал в MLOps!
Описание вакансии
**Backend / ML Infrastructure / MLOps инженер
Локация:** Удалённо в РФ, комфортно пересекаться по времени с Москвой (МСК ±3 ч)
Компания: ООО «Образовательные продукты Русяева»
ЗП: от 180 000 до 250 000 р. на руки
Занятость: Проектная, с перспективой перехода в постоянное сотрудничество
Описание вакансии:
Ищем Backend / ML Infrastructure / MLOps инженера в проект — ИИ-ассистент по судебной практике РФ (SaaS для юристов).
Делаем понятный по архитектуре продукт: собираем RAG из массива документов судов РФ и подключаем к нему self-host LLM с инструментами. Пользователь формулирует запрос обычным языком и получает развёрнутый ответ со ссылками на конкретные дела. Прототип уже работает, парсинг и индексация идут — задача финально собрать продукт.
Стек: Python и TypeScript, Postgres, Qdrant (vector search), embeddings, RAG + Reranking (Qwen), self-host LLM-инференс на собственных GPU, S3 (Backblaze B2), Sentry.
Что уже готово:
— Поиск судебной практики по смыслу, подбор похожих дел, разбор позиции судов, резюме конкретных дел.
Частично готово: аналитика по инстанциям и судьям; ссылки на конкретные дела.
Что предстоит доделать (зона работы):
— Статистические тулы для профилирования акторов
— Довести до ума инфраструктуру
— Генерация процессуальных документов (иски, жалобы, претензии) с экспортом в .docx/.pdf
— Сборка RAG + reranking в продакшн и стабильный self-host LLM-инференс
— API, мониторинг и логи качества ответов, нагрузочная стабильность
Кого ищем: middle / junior-to-middle, уверенный Python (TypeScript — плюс). Главное — умение разобраться в существующем коде и доводить фичи до прода. Опыт с RAG / LLM / vector search / парсингом больших текстовых массивов — большой плюс. Есть подробный бэклог и ведущий разработчик, который прособеседует и введёт в задачи.
*💬 Резюме отправлять:* Откликнуться
–––
Бесплатный постинг вакансий: @freeIT_job
Забирай *📚* Базу Знаний
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- TypeScript
- Python
- LLM
- PostgreSQL
- MLOps
- RAG
- S3
- Vector Search
- Sentry
- Qdrant
Возможные вопросы на собеседовании
Важно понять, как кандидат обеспечит точность ответов в юридическом домене.
Как вы планируете оценивать качество работы RAG-системы и какие метрики будете использовать для мониторинга релевантности ответов?
Проект использует собственные GPU, что требует навыков оптимизации.
Какие инструменты и подходы вы бы использовали для обеспечения стабильного и быстрого self-host инференса LLM (например, vLLM, TGI)?
Работа с судебной практикой подразумевает огромные объемы данных.
Был ли у вас опыт работы с векторными БД (в частности Qdrant) и как вы решали вопросы масштабирования поиска по большим массивам документов?
Вакансия предполагает доработку существующего кода.
Расскажите о вашем опыте работы с чужим кодом: как вы подходите к изучению архитектуры и внедрению новых фич в работающий прототип?
В стеке указан TypeScript как плюс.
Насколько уверенно вы чувствуете себя в TypeScript и готовы ли вы поддерживать части бэкенда, написанные на этом языке?
Похожие вакансии
ML разработчик (Middle)
Data инженер Middle+
ML разработчик Middle Middle+
Data Engineer Python (Middle)
Data инженер Middle
Middle инженер данных
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!