Страна: Казахстан
Зарплата: 100 000 ₽ – 200 000 ₽

+500% приглашений

Откликайтесь
на вакансии с ИИ

ГибридКонтракт

AI/ML Engineer (NLP)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Интересный проект с современным стеком (MoE, RAG) и четко прописанными задачами. Хорошая заработная плата для регионального рынка и возможность перехода в штат после завершения проекта.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует глубоких знаний в области NLP и практического опыта работы с тяжелыми LLM (20B+ параметров) на собственном оборудовании, включая настройку RAG и оптимизацию инференса. Проектная занятость предполагает быстрый вход в задачи и высокую ответственность за архитектурные решения.

Анализ зарплаты

Медиана180 000 ₽

Рынок120 000 ₽ – 250 000 ₽

Предложенная зарплата в 500 000 – 1 000 000 ₸ соответствует рыночному уровню для Middle ML-инженеров в Казахстане, однако для Senior-специалистов с глубокой экспертизой в LLM верхняя планка может быть выше.

Меня заинтересовала вакансия AI/ML Engineer в ТОО CROCOS, так как мой опыт работы с архитектурами MoE и развертыванием open-source моделей (Llama, Mistral) на on-premise серверах полностью соответствует вашим задачам. Я имею практический опыт настройки RAG-пайплайнов с использованием LangChain и векторных баз данных, таких как Qdrant и FAISS, что позволит мне эффективно реализовать базу знаний для вашего контакт-центра.

Кроме того, я уверенно владею инструментами оптимизации инференса (vLLM, Ollama) и имею опыт работы с Docker, что необходимо для стабильной работы системы. Меня привлекает возможность работы над масштабным проектом внедрения голосового и чат-бота для дорожной компании, и я готов применить свои навыки для достижения высокого качества генерации и интеграции LLM через REST API.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Crocos уже сейчас

Присоединяйтесь к разработке инновационного AI-диспетчера для крупного инфраструктурного проекта в Астане!

Описание вакансии

#jobs #Астана

*📍* Формат/working arrangement: гибрид / на месте работодателя, проектная занятость

*✔️* Должность/position: AI/ML Engineer (NLP)

*🏢* Место работы/workplace: ТОО CROCOS

*💸* Заработная плата/salary estimate: от 500 000 до 1 000 000 ₸ в месяц (на руки)

*📈* Обязанности/responsibilities:

Развёртывание open-source LLM (Mixture-of-Experts, ≥20B параметров) на on-premise GPU-сервере заказчика
Настройка RAG-пайплайна: подключение базы знаний контакт-центра, настройка векторного поиска, chunking и retrieval-стратегий
Конфигурация системных промптов, тональности ответов и фильтрации персональных данных
Настройка function calling и генерации структурированного вывода (JSON/XML) для интеграций
Оптимизация инференса: параллельная обработка запросов и управление GPU-памятью
Интеграция LLM с low-code платформой через REST API
Настройка мониторинга, логирования запросов и метрик качества ответов
Подготовка технической документации по LLM-компоненту

*📌* Требования/requirements:

Опыт развёртывания open-source LLM (Qwen, Mistral, DeepSeek, LLaMA и аналогов) от 1 года
Понимание архитектур MoE, трансформеров и механизмов внимания
Опыт построения RAG-систем с использованием LangChain, LlamaIndex или аналогов
Опыт работы с векторными БД (Qdrant, Chroma, FAISS)
Практический опыт работы с GPU-серверами (CUDA, vLLM, llama.cpp, Ollama или аналоги)
Уверенное знание Python
Понимание REST API
Базовые знания Docker и Linux
Навыки подготовки технической документации

Будет плюсом:

Опыт работы с ASR/TTS системами
Опыт решения NLP-задач для казахского языка
Опыт оптимизации моделей (quantization, GGUF, AWQ)
Участие или достижения в соревнованиях Kaggle

*✅* Условия/working conditions:

Проектная занятость сроком на 4 месяца с возможностью перехода в штат
Работа над внедрением AI-диспетчера (голосовой + чат-бот) для крупной дорожной компании
Гибридный формат работы или удалённая работа по согласованию
Современный стек: Python, LLM (MoE ≥20B), vLLM / llama.cpp, RAG, GPU Linux
Выплаты за проект
График работы: 5/2, 8-часовой рабочий день
Старт проекта: июнь 2026 года

*📢**❗️**🚨* Контакты для связи/Contact information: Откликнуться

Контактное лицо: Картов Адлет

*📍* Адрес офиса:

Астана, проспект Республики, 34А

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
Linux
LLM
RAG
NLP
Docker
JSON
REST API
CUDA
XML
LangChain
FAISS
LlamaIndex
vLLM
Qdrant
Chroma

Возможные вопросы на собеседовании

Проверка практического опыта работы с инфраструктурой для LLM.

Какие инструменты оптимизации инференса (например, vLLM или llama.cpp) вы бы выбрали для развертывания MoE-модели на 20B+ параметров и почему?

Оценка навыков построения RAG-систем.

Как вы планируете решать проблему галлюцинаций и обеспечивать релевантность поиска в RAG-пайплайне при работе с базой знаний контакт-центра?

Проверка знаний в области обработки данных и безопасности.

Какие методы фильтрации персональных данных в промптах и ответах модели вы считаете наиболее надежными?

Оценка опыта интеграции.

Опишите ваш опыт настройки function calling для генерации структурированного JSON-вывода. С какими сложностями вы сталкивались?

Проверка навыков работы с векторными БД.

По какому принципу вы выбираете стратегию чанкинга (chunking) текста для индексации в векторной базе данных?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Казахстанот 100 000 ₽

Откликайтесь
на вакансии с ИИ

AI/ML Engineer (NLP)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Crocos уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие инструменты оптимизации инференса (например, vLLM или llama.cpp) вы бы выбрали для развертывания MoE-модели на 20B+ параметров и почему?

Как вы планируете решать проблему галлюцинаций и обеспечивать релевантность поиска в RAG-пайплайне при работе с базой знаний контакт-центра?

Какие методы фильтрации персональных данных в промптах и ответах модели вы считаете наиболее надежными?

Опишите ваш опыт настройки function calling для генерации структурированного JSON-вывода. С какими сложностями вы сталкивались?

По какому принципу вы выбираете стратегию чанкинга (chunking) текста для индексации в векторной базе данных?

Похожие вакансии

AI креативный менеджер

Креатор / Менеджер по нейросетям

Senior AI Engineer / Senior Python Backend Developer

AI/LLM Инженер

Python-разработчик (NLP / AI)

Junior AI Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

AI/ML Engineer (NLP)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Crocos уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие инструменты оптимизации инференса (например, vLLM или llama.cpp) вы бы выбрали для развертывания MoE-модели на 20B+ параметров и почему?

Как вы планируете решать проблему галлюцинаций и обеспечивать релевантность поиска в RAG-пайплайне при работе с базой знаний контакт-центра?

Какие методы фильтрации персональных данных в промптах и ответах модели вы считаете наиболее надежными?

Опишите ваш опыт настройки function calling для генерации структурированного JSON-вывода. С какими сложностями вы сталкивались?

По какому принципу вы выбираете стратегию чанкинга (chunking) текста для индексации в векторной базе данных?

Похожие вакансии

AI креативный менеджер

Креатор / Менеджер по нейросетям

Senior AI Engineer / Senior Python Backend Developer

AI/LLM Инженер

Python-разработчик (NLP / AI)

Junior AI Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ