- Страна
- Россия
- Зарплата
- 180 000 ₽ – 250 000 ₽
Откликайтесь
на вакансии с ИИ

Backend / ML Infrastructure / MLOps инженер (ИИ-ассистент)
Интересный проект на стыке LegalTech и AI с современным стеком технологий. Четко описанные задачи, наличие бэклога и адекватная зарплатная вилка делают вакансию привлекательной для Middle-специалистов.
Сложность вакансии
Роль требует уверенного владения Python и понимания специфики ML-инфраструктуры (RAG, векторный поиск). Сложность заключается в необходимости работы с self-host LLM и большими массивами текстовых данных.
Анализ зарплаты
Предложенная вилка 180 000 – 250 000 ₽ на руки соответствует рыночному уровню для Middle Python/MLOps инженера в России, особенно для проектной работы с перспективой штата.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в ООО «Образовательные продукты Русяева» уже сейчас
Присоединяйтесь к созданию инновационного ИИ-ассистента для юристов и работайте с передовым стеком LLM и RAG!
Описание вакансии
Публикатор: Andrew Petushkov
Обсуждение:
Формат работы: удалёнка (офиса нет)
Город: не важно, работаем по РФ; комфортно пересекаться по времени с Москвой (МСК ±3 ч)
Занятость: проектная, с перспективой перехода в постоянное сотрудничество
Зарплатная вилка: от 180 000 до 250 000 ₽/мес (на руки)
Описание вакансии:
Ищем Backend / ML Infrastructure / MLOps инженера в проект — ИИ-ассистент по судебной практике РФ (SaaS для юристов).
Делаем понятный по архитектуре продукт: собираем RAG из массива документов судов РФ и подключаем к нему self-host LLM с инструментами. Пользователь формулирует запрос обычным языком и получает развёрнутый ответ со ссылками на конкретные дела. Прототип уже работает, парсинг и индексация идут — задача финально собрать продукт.
Стек: Python и TypeScript, Postgres, Qdrant (vector search), embeddings, RAG + Reranking (Qwen), self-host LLM-инференс на собственных GPU, S3 (Backblaze B2), Sentry.
Что уже готово:
— Поиск судебной практики по смыслу, подбор похожих дел, разбор позиции судов, резюме конкретных дел.
Частично готово: аналитика по инстанциям и судьям; ссылки на конкретные дела.
Что предстоит доделать (зона работы):
— Статистические тулы для профилирования акторов
— Довести до ума инфраструктуру
— Генерация процессуальных документов (иски, жалобы, претензии) с экспортом в .docx/.pdf
— Сборка RAG + reranking в продакшн и стабильный self-host LLM-инференс
— API, мониторинг и логи качества ответов, нагрузочная стабильность
Кого ищем: middle / junior-to-middle, уверенный Python (TypeScript — плюс). Главное — умение разобраться в существующем коде и доводить фичи до прода. Опыт с RAG / LLM / vector search / парсингом больших текстовых массивов — большой плюс. Есть подробный бэклог и ведущий разработчик, который прособеседует и введёт в задачи.
Название компании: ООО «Образовательные продукты Русяева»
Контакты: Андрей, Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- TypeScript
- Python
- LLM
- PostgreSQL
- MLOps
- RAG
- S3
- Vector Search
- Sentry
- Qdrant
Возможные вопросы на собеседовании
Проект активно использует RAG для работы с судебной практикой.
Расскажите о вашем опыте реализации RAG-систем: какие стратегии индексации и реранкинга вы использовали?
В вакансии указано использование Qdrant для векторного поиска.
Какие преимущества и недостатки вы видите в использовании Qdrant по сравнению с другими векторными БД (например, Pinecone или Weaviate)?
Проект предполагает self-host LLM-инференс на собственных GPU.
С какими инструментами для оптимизации инференса LLM вы работали (vLLM, TGI, NVIDIA Triton)?
Одной из задач является сборка RAG в продакшн и обеспечение стабильности.
Как бы вы организовали мониторинг качества ответов LLM и производительности системы в условиях реальной нагрузки?
Упоминается работа с PostgreSQL и S3.
Как вы организуете хранение и версионирование больших объемов неструктурированных данных (судебных документов) для обучения и поиска?
Похожие вакансии
Backend / ML Infrastructure / MLOps инженер
ML разработчик (Middle)
Data инженер Middle+
Data Engineer Python (Middle)
ML разработчик Middle Middle+
Data инженер Middle
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!