Страна: Россия
Зарплата: 240 000 ₽ – 320 000 ₽

+500% приглашений

Откликайтесь
на вакансии с ИИ

SeniorУдалённоПолная занятость

AI/ML Engineer

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Привлекательная вакансия с четким стеком технологий и актуальными задачами в области LLM. Зарплатная вилка соответствует рынку для уровня Middle+/Senior, а возможность удаленной работы из РФ является значительным плюсом.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена требованиями к глубокому опыту (5+ лет) и специфическим навыкам в области LLM, RAG и оптимизации инференса на GPU. Роль требует сочетания сильной инженерной базы (Python, FastAPI, K8s) и актуальных знаний в быстрорастущей сфере Generative AI.

Анализ зарплаты

Медиана300 000 ₽

Рынок250 000 ₽ – 450 000 ₽

Предложенная вилка 240 000 – 320 000 рублей на руки соответствует среднерыночным показателям для Senior ML-инженеров в России, специализирующихся на LLM. Верхняя граница может быть чуть ниже топовых предложений бигтеха, но остается конкурентоспособной для стабильной компании.

Меня заинтересовала вакансия AI/ML Engineer в компании JETLYN, так как мой опыт в разработке RAG-пайплайнов и оптимизации инференса моделей полностью соответствует вашим задачам. Я обладаю глубокими знаниями Python (FastAPI, asyncio) и имею практический опыт работы с векторными базами данных и фреймворками LangChain/LlamaIndex для создания масштабируемых LLM-решений.

В своей практике я уделяю особое внимание не только качеству генерации, но и вопросам AI safety, а также настройке observability и метрик. Уверен, что мой опыт вывода моделей в продакшн и работы с GPU-инфраструктурой позволит мне эффективно решать задачи по построению LLM routing слоя и оптимизации производительности систем в JETLYN.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в JETLYN уже сейчас

Отправьте свое резюме @Geniya_HR, чтобы присоединиться к команде JETLYN и работать над передовыми LLM-решениями!

Описание вакансии

#РФ #вакансия #удаленно #remote #AI #ML #Python #MLEngineer

**Вакансия: AI/ML Engineer

Грейд: Middle+**/Senior**Компания: JETLYN

Формат: удаленно

Локация: Россия

Гражданство: РФ

Вилка ЗП: от 240 000 до 320 000 рублей на руки в месяц

Условия оформления, формат: ТК/ИП**

🟡Задачи:

Разработка LLM routing / gateway слоя

Построение и оптимизация RAG-пайплайнов

Внедрение guardrails и AI safety

Настройка observability, трейсинга и метрик

Оптимизация inference (latency / throughput / cost)

Построение evaluation-пайплайнов

Работа с GPU-инфраструктурой и масштабированием

🟡Требования:

❗️5+ лет в ML / AI

Опыт вывода моделей в production

Глубокое понимание RAG (vector DB + фреймворки)

Сильный Python (asyncio, FastAPI)

Умение работать с метриками и экспериментами

Опыт работы с LLM-продуктами

Понимание AI safety и рисков

Плюсом будет:

Agentic RAG / multi-agent системы

Fine-tuning (LoRA / QLoRA)

Multimodal (CV / audio)

ASR / TTS / OCR / NER

Evaluation-фреймворки (RAGAS, deepeval)

Оптимизация inference (quantization, batching, KV-cache)

Стек:

Python 3.12+, FastAPI, LangChain / LlamaIndex, Qdrant / Chroma / Pinecone, vLLM / Ollama, Docker, Kubernetes, GPU (A10 / A100)

Резюме и вопросы направляйте, пожалуйста, в телеграмм в ЛС Откликнуться 📲

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
FastAPI
LangChain
LlamaIndex
Qdrant
ChromaDB
Pinecone
vLLM
Ollama
Docker
Kubernetes
GPU
LLM
RAG
NLP
ASR
TTS
OCR
NER

Возможные вопросы на собеседовании

Проверка практического опыта оптимизации производительности LLM.

Какие методы оптимизации инференса (quantization, batching, KV-cache) вы применяли на практике и какого выигрыша в latency удалось достичь?

Оценка навыков построения качественных RAG-систем.

Как вы подходите к оценке качества RAG-пайплайнов? Какие метрики и фреймворки (например, RAGAS) используете для борьбы с галлюцинациями?

Проверка архитектурного мышления в контексте LLM.

Расскажите о вашем опыте проектирования LLM gateway или routing слоя. Как вы решаете задачу выбора между различными моделями в зависимости от запроса?

Проверка навыков работы с инфраструктурой.

С какими сложностями вы сталкивались при масштабировании LLM-сервисов в Kubernetes с использованием GPU?

Оценка знаний в области безопасности ИИ.

Какие подходы к внедрению guardrails и обеспечению AI safety вы считаете наиболее эффективными для корпоративных продуктов?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россияот 240 000 ₽

Откликайтесь
на вакансии с ИИ

AI/ML Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в JETLYN уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие методы оптимизации инференса (quantization, batching, KV-cache) вы применяли на практике и какого выигрыша в latency удалось достичь?

Как вы подходите к оценке качества RAG-пайплайнов? Какие метрики и фреймворки (например, RAGAS) используете для борьбы с галлюцинациями?

Расскажите о вашем опыте проектирования LLM gateway или routing слоя. Как вы решаете задачу выбора между различными моделями в зависимости от запроса?

С какими сложностями вы сталкивались при масштабировании LLM-сервисов в Kubernetes с использованием GPU?

Какие подходы к внедрению guardrails и обеспечению AI safety вы считаете наиболее эффективными для корпоративных продуктов?

Похожие вакансии

Data инженер

Главный инженер Контроль качества данных

Senior Data Engineer

Data Scientist Senior

ML Engineer, Senior

Senior AI-First Data Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

AI/ML Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в JETLYN уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие методы оптимизации инференса (quantization, batching, KV-cache) вы применяли на практике и какого выигрыша в latency удалось достичь?

Как вы подходите к оценке качества RAG-пайплайнов? Какие метрики и фреймворки (например, RAGAS) используете для борьбы с галлюцинациями?

Расскажите о вашем опыте проектирования LLM gateway или routing слоя. Как вы решаете задачу выбора между различными моделями в зависимости от запроса?

С какими сложностями вы сталкивались при масштабировании LLM-сервисов в Kubernetes с использованием GPU?

Какие подходы к внедрению guardrails и обеспечению AI safety вы считаете наиболее эффективными для корпоративных продуктов?

Похожие вакансии

Data инженер

Главный инженер Контроль качества данных

Senior Data Engineer

Data Scientist Senior

ML Engineer, Senior

Senior AI-First Data Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ