- Страна
- Россия
- Зарплата
- 240 000 ₽ – 320 000 ₽
Откликайтесь
на вакансии с ИИ

AI/ML Engineer
Привлекательная вакансия с четким стеком технологий и актуальными задачами в области LLM. Зарплатная вилка соответствует рынку для уровня Middle+/Senior, а возможность удаленной работы из РФ является значительным плюсом.
Сложность вакансии
Высокая сложность обусловлена требованиями к глубокому опыту (5+ лет) и специфическим навыкам в области LLM, RAG и оптимизации инференса на GPU. Роль требует сочетания сильной инженерной базы (Python, FastAPI, K8s) и актуальных знаний в быстрорастущей сфере Generative AI.
Анализ зарплаты
Предложенная вилка 240 000 – 320 000 рублей на руки соответствует среднерыночным показателям для Senior ML-инженеров в России, специализирующихся на LLM. Верхняя граница может быть чуть ниже топовых предложений бигтеха, но остается конкурентоспособной для стабильной компании.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в JETLYN уже сейчас
Отправьте свое резюме @Geniya_HR, чтобы присоединиться к команде JETLYN и работать над передовыми LLM-решениями!
Описание вакансии
#РФ #вакансия #удаленно #remote #AI #ML #Python #MLEngineer
**Вакансия: AI/ML Engineer
Грейд: Middle+**/Senior**Компания: JETLYN
Формат: удаленно
Локация: Россия
Гражданство: РФ
Вилка ЗП: от 240 000 до 320 000 рублей на руки в месяц
Условия оформления, формат: ТК/ИП**
🟡Задачи:
Разработка LLM routing / gateway слоя
Построение и оптимизация RAG-пайплайнов
Внедрение guardrails и AI safety
Настройка observability, трейсинга и метрик
Оптимизация inference (latency / throughput / cost)
Построение evaluation-пайплайнов
Работа с GPU-инфраструктурой и масштабированием
🟡Требования:
❗️5+ лет в ML / AI
Опыт вывода моделей в production
Глубокое понимание RAG (vector DB + фреймворки)
Сильный Python (asyncio, FastAPI)
Умение работать с метриками и экспериментами
Опыт работы с LLM-продуктами
Понимание AI safety и рисков
Плюсом будет:
Agentic RAG / multi-agent системы
Fine-tuning (LoRA / QLoRA)
Multimodal (CV / audio)
ASR / TTS / OCR / NER
Evaluation-фреймворки (RAGAS, deepeval)
Оптимизация inference (quantization, batching, KV-cache)
Стек:
Python 3.12+, FastAPI, LangChain / LlamaIndex, Qdrant / Chroma / Pinecone, vLLM / Ollama, Docker, Kubernetes, GPU (A10 / A100)
Резюме и вопросы направляйте, пожалуйста, в телеграмм в ЛС Откликнуться 📲
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- FastAPI
- LangChain
- LlamaIndex
- Qdrant
- ChromaDB
- Pinecone
- vLLM
- Ollama
- Docker
- Kubernetes
- GPU
- LLM
- RAG
- NLP
- ASR
- TTS
- OCR
- NER
Возможные вопросы на собеседовании
Проверка практического опыта оптимизации производительности LLM.
Какие методы оптимизации инференса (quantization, batching, KV-cache) вы применяли на практике и какого выигрыша в latency удалось достичь?
Оценка навыков построения качественных RAG-систем.
Как вы подходите к оценке качества RAG-пайплайнов? Какие метрики и фреймворки (например, RAGAS) используете для борьбы с галлюцинациями?
Проверка архитектурного мышления в контексте LLM.
Расскажите о вашем опыте проектирования LLM gateway или routing слоя. Как вы решаете задачу выбора между различными моделями в зависимости от запроса?
Проверка навыков работы с инфраструктурой.
С какими сложностями вы сталкивались при масштабировании LLM-сервисов в Kubernetes с использованием GPU?
Оценка знаний в области безопасности ИИ.
Какие подходы к внедрению guardrails и обеспечению AI safety вы считаете наиболее эффективными для корпоративных продуктов?
Похожие вакансии
Data инженер Middle+ Senior
Senior Data Engineer
Data Scientist (Senior)
Data инженер (Senior)
Data Engineer
Senior Data инженер
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Россия
- Зарплата
- 240 000 ₽ – 320 000 ₽