Страна: Казахстан

+500% приглашений

Откликайтесь
на вакансии с ИИ

SeniorГибридПолная занятость

Senior ML Engineer (LLM / RAG)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Отличная вакансия для Senior-специалиста: работа с передовым стеком (LLM, RAG, Agents), международный масштаб (12 стран) и четко прописанные технические требования. Гибкий формат работы и фокус на востребованную нишу Voice AI делают предложение очень привлекательным.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена требованиями к глубокому опыту с LLM в продакшене и знанием специфических инструментов (LangGraph, vLLM). Позиция Senior подразумевает ответственность за архитектуру RAG-пайплайнов и оптимизацию стоимости/задержек в высоконагруженной системе.

Анализ зарплаты

Медиана6 500 $

Рынок5 000 $ – 8 500 $

Зарплата в объявлении не указана, но для позиции Senior ML Engineer в Казахстане или на удаленке в финтехе рыночный диапазон обычно составляет $5000–$8000. Учитывая международный масштаб компании, можно ожидать конкурентное предложение на уровне верхних границ рынка.

I am writing to express my strong interest in the Senior ML Engineer position at Cybernet AI. With over 4 years of experience in Machine Learning and a specialized focus on Large Language Models, I have successfully built and deployed RAG-based systems that balance high performance with cost-efficiency. My expertise in LangGraph and LlamaIndex aligns perfectly with your goal of developing complex agents for the Intelligence Core.

In my previous roles, I have optimized inference using vLLM and implemented sophisticated retrieval strategies using Milvus and hybrid search. I am particularly excited about the opportunity to scale these solutions across 12 countries and work on high-load production environments. I am confident that my technical background in LoRA/PEFT and re-ranking techniques will contribute significantly to the quality and reliability of your voice AI products.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Cybernet AI уже сейчас

Присоединяйтесь к Cybernet AI, чтобы создавать передовые LLM-решения для международного финтеха!

Описание вакансии

Senior ML Engineer (LLM / RAG) в Cybernet AI

📍 Удалёнка / Офис или гибрид в Алматы 🇰🇿

💎 Развивать Intelligence Core голосового AI для финтех-продукта в 12 странах: строить сложных агентов через LangGraph/LlamaIndex, глубоко работать с RAG-пайплайнами и оптимизировать инференс в высоконагруженном продакшене.

💼 3–5 лет в ML, опыт с LLM в проде, знание Milvus/Elastic, Hybrid Search, Re-rankers, vLLM, LoRA/PEFT. Важно умение балансировать между качеством ответов, задержкой и стоимостью системы.

Cybernet AI— компания, разрабатывающая голосовой AI для финтеха, работающая в 12 странах.

Откликнуться

———

Не подошла вакансия? Поделись с тем, кому пригодится ➡️

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

LLM
RAG
LangGraph
LlamaIndex
Milvus
ElasticSearch
vLLM
LoRA
PEFT
Python
Machine Learning

Возможные вопросы на собеседовании

Проверка опыта работы с инструментами для создания сложных агентских систем, указанных в вакансии.

Расскажите о вашем опыте использования LangGraph или LlamaIndex для построения многошаговых агентов. С какими основными трудностями вы сталкивались?

Важная часть вакансии — работа с RAG и качеством поиска.

Как вы подходите к оценке качества RAG-пайплайна? Какие метрики используете для оценки релевантности поиска и точности генерации?

В описании упомянута необходимость балансировать между задержкой и стоимостью.

Какие методы оптимизации инференса LLM вы применяли на практике для снижения Latency и GPU-костов (например, квантование, vLLM, спекулятивное декодирование)?

Требуется знание векторных БД и гибридного поиска.

В каких случаях вы бы предпочли Milvus вместо ElasticSearch для RAG-системы, и как настроить эффективный Hybrid Search?

Вакансия предполагает дообучение моделей.

Опишите ваш опыт применения LoRA или PEFT. В каких сценариях дообучение давало значимый прирост качества по сравнению с Prompt Engineering?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Казахстан

Откликайтесь
на вакансии с ИИ

Senior ML Engineer (LLM / RAG)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Cybernet AI уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте использования LangGraph или LlamaIndex для построения многошаговых агентов. С какими основными трудностями вы сталкивались?

Как вы подходите к оценке качества RAG-пайплайна? Какие метрики используете для оценки релевантности поиска и точности генерации?

Какие методы оптимизации инференса LLM вы применяли на практике для снижения Latency и GPU-костов (например, квантование, vLLM, спекулятивное декодирование)?

В каких случаях вы бы предпочли Milvus вместо ElasticSearch для RAG-системы, и как настроить эффективный Hybrid Search?

Опишите ваш опыт применения LoRA или PEFT. В каких сценариях дообучение давало значимый прирост качества по сравнению с Prompt Engineering?

Похожие вакансии

Senior Data Scientist

Senior MLOps инженер

Senior MLOps инженер

Senior Data Engineer

Python разработчик (DWH/Data Engineering)

Data Scientist Middle+, Senior

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Senior ML Engineer (LLM / RAG)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Cybernet AI уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте использования LangGraph или LlamaIndex для построения многошаговых агентов. С какими основными трудностями вы сталкивались?

Как вы подходите к оценке качества RAG-пайплайна? Какие метрики используете для оценки релевантности поиска и точности генерации?

Какие методы оптимизации инференса LLM вы применяли на практике для снижения Latency и GPU-костов (например, квантование, vLLM, спекулятивное декодирование)?

В каких случаях вы бы предпочли Milvus вместо ElasticSearch для RAG-системы, и как настроить эффективный Hybrid Search?

Опишите ваш опыт применения LoRA или PEFT. В каких сценариях дообучение давало значимый прирост качества по сравнению с Prompt Engineering?

Похожие вакансии

Senior Data Scientist

Senior MLOps инженер

Senior MLOps инженер

Senior Data Engineer

Python разработчик (DWH/Data Engineering)

Data Scientist Middle+, Senior

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ