- Страна
- Казахстан
- Зарплата
- 6 000 $ – 8 000 $
Откликайтесь
на вакансии с ИИ

GenAI Engineer (LLMs · RAG · ML Systems) — Senior
Отличное предложение с высокой зарплатой в валюте (USD) для рынка Казахстана. Продуктовая компания, работа с передовым стеком технологий (GenAI, RAG) и гибридный график делают вакансию крайне привлекательной для опытных инженеров.
Сложность вакансии
Высокая сложность обусловлена требованиями к огромному опыту (8+ лет в Python, 6+ лет в ML) и глубокой экспертизе в специфических инструментах вроде NVIDIA Triton и Vertex AI. Роль Senior-уровня предполагает не только разработку, но и оптимизацию инференса на GPU.
Анализ зарплаты
Предложенная зарплата ($6000–8000) находится на верхней границе или даже выше среднего рыночного уровня для Senior ML/AI ролей в Казахстане, что соответствует высоким требованиям к стеку.
Сопроводительное письмо
I am writing to express my strong interest in the Senior GenAI Engineer position. With over 8 years of production Python experience and a deep focus on LLMs and RAG pipelines, I have successfully built and deployed AI agents that handle real-time interactions. My background aligns perfectly with your requirements for expertise in Vertex AI, Amazon SageMaker, and NVIDIA Triton Inference Server.
In my previous roles, I have optimized ML inference for high-load systems and developed multimodal pipelines integrating text and voice. I am particularly excited about the opportunity to work on AI agents for real-time call and chat processing at your product company. My experience with time-series analysis and GPU acceleration will allow me to contribute effectively to your team's technical challenges from day one.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Продуктовая IT-компания уже сейчас
Откликайтесь на вакансию через HeadHunter, чтобы стать частью команды, создающей передовые GenAI-решения в Алматы!
Описание вакансии
#genai #almaty
📍 Формат/working arrangement:
гибрид, полная занятость, г. Алматы
✔️ Должность/position:
GenAI Engineer (LLMs · RAG · ML Systems) — Senior
🏢 Место работы/workplace:
продуктовая IT-компания
💸 Заработная плата/salary estimate:
6 000 – 8 000 $ (до вычета налогов)
📈 Обязанности/responsibilities:
• Разработка и развитие AI-агентов для обработки звонков и чатов в режиме реального времени
• Построение и поддержка RAG-конвейеров и ML-систем в production
• Работа с LLM: дизайн поиска, промптинг, оценка качества моделей
• Анализ временных рядов (прогнозирование, выявление точек изменений и дрейфа)
• Разработка мультимодальных pipeline (текст, голос, изображения)
• Оптимизация ML-инференса и работа с GPU / ускорителями
📌 Требования/requirements:
• Опыт работы от 6+ лет с production ML-системами
• Опыт от 3 лет разработки AI-агентов и RAG pipeline
• Уверенный Python (production опыт от 8 лет)
• Опыт работы с Google ADK
• Опыт работы с Vertex AI RAG Engine
• Опыт работы с Amazon SageMaker
• Опыт работы с NVIDIA Triton Inference Server
• Опыт работы с GPU / ускорителями
• Английский язык уровня B2+ (разговорный)
• Готовность работать full-time в гибридном формате
Будет плюсом:
• Опыт Self-Supervised / Weakly-Supervised Learning
• Опыт разработки мультимодальных решений
• Опыт анализа временных рядов
✅ Условия/working conditions:
• Конкурентоспособная заработная плата в USD
• Гибридный формат работы (2 дня в офисе)
• Гибкий график работы
• Работа в продуктовой компании
• Возможности профессионального роста
📢❗️🚨 Контакты для связи:
через отклик на вакансию
🌐 Ссылка на вакансию:Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- LLM
- RAG
- Vertex AI
- Amazon SageMaker
- NVIDIA Triton Inference Server
- GPU
- Machine Learning
- Time Series Analysis
- Multimodal
Возможные вопросы на собеседовании
Проверка опыта работы с высоконагруженными ML-системами.
Расскажите о вашем опыте оптимизации NVIDIA Triton Inference Server для работы с LLM в реальном времени.
Оценка навыков построения сложных RAG-систем.
Как вы решали проблему галлюцинаций и оценивали качество ответов в ваших RAG-конвейерах?
Проверка владения облачными ML-платформами.
В чем заключаются основные преимущества и сложности использования Vertex AI RAG Engine по сравнению с кастомными решениями?
Оценка навыков работы с мультимодальностью.
С какими основными вызовами вы сталкивались при синхронизации текстовых и голосовых потоков в мультимодальных пайплайнах?
Проверка знаний в области анализа временных рядов.
Какие методы вы используете для обнаружения дрейфа данных (data drift) в production-системах?
Похожие вакансии
Middle, Middle+, Senior GenAI/LLM Разработчик
Middle / Senior GenAI Engineer (CV)
Senior / Lead LLM Engineer
Senior Computer Vision Engineer
AI Platform Engineer (RAG/Agents/Skills)
Senior LLM engineer (ASR/TTS)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Казахстан
- Зарплата
- 6 000 $ – 8 000 $