- Страна
- Казахстан
Откликайтесь
на вакансии с ИИ

Senior ML Engineer (LLM / RAG)
Отличная вакансия для Senior-специалиста: работа с передовым стеком (LLM, RAG, Agents), международный масштаб (12 стран) и четко прописанные технические требования. Гибкий формат работы и фокус на востребованную нишу Voice AI делают предложение очень привлекательным.
Сложность вакансии
Высокая сложность обусловлена требованиями к глубокому опыту с LLM в продакшене и знанием специфических инструментов (LangGraph, vLLM). Позиция Senior подразумевает ответственность за архитектуру RAG-пайплайнов и оптимизацию стоимости/задержек в высоконагруженной системе.
Анализ зарплаты
Зарплата в объявлении не указана, но для позиции Senior ML Engineer в Казахстане или на удаленке в финтехе рыночный диапазон обычно составляет $5000–$8000. Учитывая международный масштаб компании, можно ожидать конкурентное предложение на уровне верхних границ рынка.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Cybernet AI уже сейчас
Присоединяйтесь к Cybernet AI, чтобы создавать передовые LLM-решения для международного финтеха!
Описание вакансии
Senior ML Engineer (LLM / RAG) в Cybernet AI
📍 Удалёнка / Офис или гибрид в Алматы 🇰🇿
💎 Развивать Intelligence Core голосового AI для финтех-продукта в 12 странах: строить сложных агентов через LangGraph/LlamaIndex, глубоко работать с RAG-пайплайнами и оптимизировать инференс в высоконагруженном продакшене.
💼 3–5 лет в ML, опыт с LLM в проде, знание Milvus/Elastic, Hybrid Search, Re-rankers, vLLM, LoRA/PEFT. Важно умение балансировать между качеством ответов, задержкой и стоимостью системы.
Cybernet AI— компания, разрабатывающая голосовой AI для финтеха, работающая в 12 странах.
———
Не подошла вакансия? Поделись с тем, кому пригодится ➡️
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- Machine Learning
- LLM
- LoRA
- RAG
- ElasticSearch
- LangGraph
- Milvus
- LlamaIndex
- vLLM
- PEFT
Возможные вопросы на собеседовании
Проверка опыта работы с инструментами для создания сложных агентских систем, указанных в вакансии.
Расскажите о вашем опыте использования LangGraph или LlamaIndex для построения многошаговых агентов. С какими основными трудностями вы сталкивались?
Важная часть вакансии — работа с RAG и качеством поиска.
Как вы подходите к оценке качества RAG-пайплайна? Какие метрики используете для оценки релевантности поиска и точности генерации?
В описании упомянута необходимость балансировать между задержкой и стоимостью.
Какие методы оптимизации инференса LLM вы применяли на практике для снижения Latency и GPU-костов (например, квантование, vLLM, спекулятивное декодирование)?
Требуется знание векторных БД и гибридного поиска.
В каких случаях вы бы предпочли Milvus вместо ElasticSearch для RAG-системы, и как настроить эффективный Hybrid Search?
Вакансия предполагает дообучение моделей.
Опишите ваш опыт применения LoRA или PEFT. В каких сценариях дообучение давало значимый прирост качества по сравнению с Prompt Engineering?
Похожие вакансии
ML разработчик (Senior)
Senior / Middle+ Data Scientist
MlOps / Python Backend Engineer (ML)
Data Scientist Senior
Senior/Middle Data Engineer
Senior Data Scientist
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!