yandex
J
JETLYN
Страна
Россия
Зарплата
240 000 ₽ – 320 000 ₽
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorУдалённоПолная занятость

AI/ML Engineer

Оценка ИИ

Привлекательная вакансия с четким стеком технологий и актуальными задачами в области LLM. Зарплатная вилка соответствует рынку для уровня Middle+/Senior, а возможность удаленной работы из РФ является значительным плюсом.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Высокая сложность обусловлена требованиями к глубокому опыту (5+ лет) и специфическим навыкам в области LLM, RAG и оптимизации инференса на GPU. Роль требует сочетания сильной инженерной базы (Python, FastAPI, K8s) и актуальных знаний в быстрорастущей сфере Generative AI.

Анализ зарплаты

Медиана300 000 ₽
Рынок250 000 ₽ – 450 000 ₽
Оценка ИИ

Предложенная вилка 240 000 – 320 000 рублей на руки соответствует среднерыночным показателям для Senior ML-инженеров в России, специализирующихся на LLM. Верхняя граница может быть чуть ниже топовых предложений бигтеха, но остается конкурентоспособной для стабильной компании.

Сопроводительное письмо

Меня заинтересовала вакансия AI/ML Engineer в компании JETLYN, так как мой опыт в разработке RAG-пайплайнов и оптимизации инференса моделей полностью соответствует вашим задачам. Я обладаю глубокими знаниями Python (FastAPI, asyncio) и имею практический опыт работы с векторными базами данных и фреймворками LangChain/LlamaIndex для создания масштабируемых LLM-решений.

В своей практике я уделяю особое внимание не только качеству генерации, но и вопросам AI safety, а также настройке observability и метрик. Уверен, что мой опыт вывода моделей в продакшн и работы с GPU-инфраструктурой позволит мне эффективно решать задачи по построению LLM routing слоя и оптимизации производительности систем в JETLYN.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в JETLYN уже сейчас

Отправьте свое резюме @Geniya_HR, чтобы присоединиться к команде JETLYN и работать над передовыми LLM-решениями!

Описание вакансии

#РФ #вакансия #удаленно #remote #AI #ML #Python #MLEngineer

**Вакансия: AI/ML Engineer

Грейд: Middle+**/Senior**Компания: JETLYN

Формат: удаленно

Локация: Россия

Гражданство: РФ

Вилка ЗП: от 240 000 до 320 000 рублей на руки в месяц

Условия оформления, формат: ТК/ИП**

🟡Задачи:

Разработка LLM routing / gateway слоя

Построение и оптимизация RAG-пайплайнов

Внедрение guardrails и AI safety

Настройка observability, трейсинга и метрик

Оптимизация inference (latency / throughput / cost)

Построение evaluation-пайплайнов

Работа с GPU-инфраструктурой и масштабированием

🟡Требования:

❗️5+ лет в ML / AI

Опыт вывода моделей в production

Глубокое понимание RAG (vector DB + фреймворки)

Сильный Python (asyncio, FastAPI)

Умение работать с метриками и экспериментами

Опыт работы с LLM-продуктами

Понимание AI safety и рисков

Плюсом будет:

Agentic RAG / multi-agent системы

Fine-tuning (LoRA / QLoRA)

Multimodal (CV / audio)

ASR / TTS / OCR / NER

Evaluation-фреймворки (RAGAS, deepeval)

Оптимизация inference (quantization, batching, KV-cache)

Стек:

Python 3.12+, FastAPI, LangChain / LlamaIndex, Qdrant / Chroma / Pinecone, vLLM / Ollama, Docker, Kubernetes, GPU (A10 / A100)

Резюме и вопросы направляйте, пожалуйста, в телеграмм в ЛС Откликнуться 📲

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • FastAPI
  • LangChain
  • LlamaIndex
  • Qdrant
  • ChromaDB
  • Pinecone
  • vLLM
  • Ollama
  • Docker
  • Kubernetes
  • GPU
  • LLM
  • RAG
  • NLP
  • ASR
  • TTS
  • OCR
  • NER

Возможные вопросы на собеседовании

Проверка практического опыта оптимизации производительности LLM.

Какие методы оптимизации инференса (quantization, batching, KV-cache) вы применяли на практике и какого выигрыша в latency удалось достичь?

Оценка навыков построения качественных RAG-систем.

Как вы подходите к оценке качества RAG-пайплайнов? Какие метрики и фреймворки (например, RAGAS) используете для борьбы с галлюцинациями?

Проверка архитектурного мышления в контексте LLM.

Расскажите о вашем опыте проектирования LLM gateway или routing слоя. Как вы решаете задачу выбора между различными моделями в зависимости от запроса?

Проверка навыков работы с инфраструктурой.

С какими сложностями вы сталкивались при масштабировании LLM-сервисов в Kubernetes с использованием GPU?

Оценка знаний в области безопасности ИИ.

Какие подходы к внедрению guardrails и обеспечению AI safety вы считаете наиболее эффективными для корпоративных продуктов?

Похожие вакансии

более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

J
JETLYN
Страна
Россия
Зарплата
240 000 ₽ – 320 000 ₽