- Страна
- Казахстан
- Зарплата
- 100 000 ₽ – 200 000 ₽
Откликайтесь
на вакансии с ИИ

AI/ML Engineer (NLP)
Интересный проект с современным стеком (MoE, RAG) и четко прописанными задачами. Хорошая заработная плата для регионального рынка и возможность перехода в штат после завершения проекта.
Сложность вакансии
Роль требует глубоких знаний в области NLP и практического опыта работы с тяжелыми LLM (20B+ параметров) на собственном оборудовании, включая настройку RAG и оптимизацию инференса. Проектная занятость предполагает быстрый вход в задачи и высокую ответственность за архитектурные решения.
Анализ зарплаты
Предложенная зарплата в 500 000 – 1 000 000 ₸ соответствует рыночному уровню для Middle ML-инженеров в Казахстане, однако для Senior-специалистов с глубокой экспертизой в LLM верхняя планка может быть выше.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Crocos уже сейчас
Присоединяйтесь к разработке инновационного AI-диспетчера для крупного инфраструктурного проекта в Астане!
Описание вакансии
*📍* Формат/working arrangement: гибрид / на месте работодателя, проектная занятость
*✔️* Должность/position: AI/ML Engineer (NLP)
*🏢* Место работы/workplace: ТОО CROCOS
*💸* Заработная плата/salary estimate: от 500 000 до 1 000 000 ₸ в месяц (на руки)
*📈* Обязанности/responsibilities:
- Развёртывание open-source LLM (Mixture-of-Experts, ≥20B параметров) на on-premise GPU-сервере заказчика
- Настройка RAG-пайплайна: подключение базы знаний контакт-центра, настройка векторного поиска, chunking и retrieval-стратегий
- Конфигурация системных промптов, тональности ответов и фильтрации персональных данных
- Настройка function calling и генерации структурированного вывода (JSON/XML) для интеграций
- Оптимизация инференса: параллельная обработка запросов и управление GPU-памятью
- Интеграция LLM с low-code платформой через REST API
- Настройка мониторинга, логирования запросов и метрик качества ответов
- Подготовка технической документации по LLM-компоненту
*📌* Требования/requirements:
- Опыт развёртывания open-source LLM (Qwen, Mistral, DeepSeek, LLaMA и аналогов) от 1 года
- Понимание архитектур MoE, трансформеров и механизмов внимания
- Опыт построения RAG-систем с использованием LangChain, LlamaIndex или аналогов
- Опыт работы с векторными БД (Qdrant, Chroma, FAISS)
- Практический опыт работы с GPU-серверами (CUDA, vLLM, llama.cpp, Ollama или аналоги)
- Уверенное знание Python
- Понимание REST API
- Базовые знания Docker и Linux
- Навыки подготовки технической документации
Будет плюсом:
- Опыт работы с ASR/TTS системами
- Опыт решения NLP-задач для казахского языка
- Опыт оптимизации моделей (quantization, GGUF, AWQ)
- Участие или достижения в соревнованиях Kaggle
*✅* Условия/working conditions:
- Проектная занятость сроком на 4 месяца с возможностью перехода в штат
- Работа над внедрением AI-диспетчера (голосовой + чат-бот) для крупной дорожной компании
- Гибридный формат работы или удалённая работа по согласованию
- Современный стек: Python, LLM (MoE ≥20B), vLLM / llama.cpp, RAG, GPU Linux
- Выплаты за проект
- График работы: 5/2, 8-часовой рабочий день
- Старт проекта: июнь 2026 года
*📢**❗️**🚨* Контакты для связи/Contact information: Откликнуться
Контактное лицо: Картов Адлет
*📍* Адрес офиса:
Астана, проспект Республики, 34А
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- Linux
- LLM
- RAG
- NLP
- Docker
- JSON
- REST API
- CUDA
- XML
- LangChain
- FAISS
- LlamaIndex
- vLLM
- Qdrant
- Chroma
Возможные вопросы на собеседовании
Проверка практического опыта работы с инфраструктурой для LLM.
Какие инструменты оптимизации инференса (например, vLLM или llama.cpp) вы бы выбрали для развертывания MoE-модели на 20B+ параметров и почему?
Оценка навыков построения RAG-систем.
Как вы планируете решать проблему галлюцинаций и обеспечивать релевантность поиска в RAG-пайплайне при работе с базой знаний контакт-центра?
Проверка знаний в области обработки данных и безопасности.
Какие методы фильтрации персональных данных в промптах и ответах модели вы считаете наиболее надежными?
Оценка опыта интеграции.
Опишите ваш опыт настройки function calling для генерации структурированного JSON-вывода. С какими сложностями вы сталкивались?
Проверка навыков работы с векторными БД.
По какому принципу вы выбираете стратегию чанкинга (chunking) текста для индексации в векторной базе данных?
Похожие вакансии
AI креативный менеджер
Креатор / Менеджер по нейросетям
Senior AI Engineer / Senior Python Backend Developer
AI/LLM Инженер
Python-разработчик (NLP / AI)
Junior AI Engineer
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!