- Страна
- Казахстан
- Зарплата
- от 1 000 000 ₽
Откликайтесь
на вакансии с ИИ

Senior NLP Engineer
Вакансия предлагает работу над сложным и инновационным продуктом в сфере LegalTech с использованием современного стека (LLM, ASR, Multimodal). Четко прописанные задачи и конкурентная заработная плата делают предложение очень привлекательным для опытных инженеров.
Сложность вакансии
Роль требует исключительной экспертизы на стыке NLP, ASR и мультимодального анализа, включая работу с просодическими признаками и юридическими онтологиями. Высокая сложность обусловлена необходимостью оптимизации моделей под специфическое оборудование (Jetson) и глубоким пониманием специфики казахского языка.
Анализ зарплаты
Предложенная зарплата от 1 000 000 тенге является конкурентной для рынка Казахстана, однако для позиции уровня Senior в области AI/NLP с такими глубокими требованиями к мультимодальности и оптимизации, она находится ближе к нижней границе рыночного диапазона для топ-специалистов. В международных компаниях или крупных финтех-структурах региона вознаграждение может быть выше.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Виктори-Технолоджи уже сейчас
Если вы готовы создавать передовые мультимодальные системы на стыке NLP и анализа эмоций, откликайтесь прямо сейчас!
Описание вакансии
#вакансия #астана #гибрид #workITkz #dsml
Должность: Senior NLP Engineer
Компания: Виктори-Технолоджи
Город: Астана
Занятость: гибрид
Оплата: от 1 000 000 тг.
Описание вакансии:
Обязанности:
-Разработка и развитие LLM-пайплайна Stage 1: cleanup транскриптов после диаризации (Sortformer + Whisper Large V3), автоматическое определение ролей спикеров и флагирование значимых событий в диалоге;
- Разработка и развитие LLM-пайплайна Stage 2: автогенерация структурированных документов в форматах DOCX/XML для backend-системы редактирования и многоступенчатая compliance-проверка по доменным правилам (~30+ нормативных требований);
- Файнтюнинг и prompt-инженерия LLM (gpt-class и open-weight моделей) под доменную задачу на казахском и русском языках; снижение hallucination rate и стабилизация выводов между запусками;
- NER в доменных текстах: участники диалога, действия, временные и пространственные метки, нормативные ссылки;
- Семантическая сегментация транскриптов: разбиение на смысловые эпизоды и выделение ключевых моментов (формальные процедуры, ходатайства, паузы, вопрос–ответ);
- Разработка eval-методик и regression-тестов LLM-выводов; ведение бенчмарков моделей (accuracy по доменным правилам, false-positive / false-negative, стабильность между запусками);
- Создание LLM-агента, который интерпретирует поведенческие и эмоциональные сигналы от CV- и Audio-модулей и формирует связный текст аналитического характера для конечного пользователя;
- Работа с юридическими онтологиями и нормативными источниками: УПК РК (в т.ч. статьи 68, 77, 115), УК РК, Конституция РК; поддержка актуальности базы знаний при изменениях законодательства;
- Дообучение и оптимизация ASR-моделей (Whisper Large V3, Sortformer V4 для диаризации) на казахском и русском языках с адаптацией под акустику целевого помещения, фоновые шумы, региональные акценты и доменную лексику; экспорт ONNX/TensorRT и развёртывание на Jetson;
- Разработка пайплайна извлечения аудио-просодических признаков (F0/pitch, jitter, shimmer, intensity, speech rate, паузы, voice quality, eGeMAPS) и моделирование на их основе психоэмоциональных маркеров (стресс, неуверенность, эмоциональное напряжение);
- Разработка финального мультимодального fusion-слоя: интеграция текстовых эмбеддингов (NLP), аудио-просодических признаков и визуальных сигналов от CV-модуля (мимика, микродвижения, поза) в единую интерпретацию психоэмоционального состояния спикера;
- Формирование итоговых аналитических выводов для конечного пользователя в виде структурированных мультимодальных аннотаций: фрагмент диалога с просодическим контекстом и поведенческими маркерами, ранжирование моментов по уровню значимости с указанием уровня уверенности модели.
Требования:
- 3+ года в NLP/LLM; опыт production-проектов с end-to-end LLM-пайплайнами;
- Глубокое знание архитектур трансформеров и LLM; опыт файнтюнинга (LoRA / QLoRA / SFT) и instruction tuning под доменные задачи;
- Уверенное владение HuggingFace Transformers, vLLM, llama.cpp; опыт inference-оптимизации (квантование, batching, KV-cache); работа с локально развёрнутыми моделями;
- Глубокие навыки построения RAG: chunking-стратегии, векторные БД (pgvector / FAISS / Pinecone), reranking, мультиязычные embeddings (включая казахский);
- Опыт минимизации галлюцинаций: structured outputs, guardrails, constrained decoding; ведение LLM-eval (ragas, LangSmith и аналоги);
- Опыт промышленной разработки на Python (FastAPI / Flask, Docker, Git); понимание юридического домена и работы с KZ/RU языками;
- Опыт дообучения ASR-моделей (Whisper / wav2vec2 / Sortformer) на доменных данных; работа с диаризацией спикеров, спикер-эмбеддингами и шумоподавлением;
- Практический опыт извлечения и моделирования аудио-просодических и paralinguistic-признаков (librosa, openSMILE, parselmouth / Praat, eGeMAPS); понимание акустических коррелятов эмоций и стресса;
- Опыт мультимодального fusion (early / late / hybrid fusion, cross-modal attention); работа с Audio Transformers (AST, HuBERT, wav2vec2) и multimodal LLM.
- Проекты в области LegalTech и цифровизации;
- Живые задачи, быстрые решения и пространство для инициативы;
- Оформление в штат, испытательный срок 3 месяца;
- График: 5/2, 9:00–18:00.
Контакты:
Telegram Откликнуться
Whatsapp 87077111920
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- NLP
- LLM
- Python
- FastAPI
- Flask
- Docker
- Git
- HuggingFace Transformers
- vLLM
- llama.cpp
- Whisper
- ASR
- RAG
- ONNX
- TensorRT
- PyTorch
- PostgreSQL
- FAISS
- Pinecone
- NER
- Prompt Engineering
- LoRA
- QLoRA
Возможные вопросы на собеседовании
Вакансия предполагает работу с юридическими текстами на казахском и русском языках. Важно понять, как кандидат справляется с нехваткой данных или спецификой морфологии.
Расскажите о вашем опыте адаптации NLP-моделей и эмбеддингов для казахского языка. С какими основными трудностями вы сталкивались при работе с этим языком в задачах NER и RAG?
В описании указано использование Whisper и Sortformer с развертыванием на Jetson. Это требует навыков оптимизации.
Какие стратегии оптимизации ASR-моделей для работы в реальном времени на edge-устройствах (например, NVIDIA Jetson) вы использовали? Как вы балансируете между точностью и задержкой (latency)?
Одной из ключевых задач является интеграция текстовых, аудио и визуальных сигналов.
Опишите ваш подход к реализации мультимодального fusion-слоя. В каких случаях вы бы предпочли early fusion перед late fusion при объединении текстовых эмбеддингов и аудио-просодических признаков?
Для LegalTech критически важна точность и отсутствие галлюцинаций.
Какие методы constrained decoding и guardrails вы применяли на практике для обеспечения строгого соответствия LLM-вывода заданным нормативным требованиям и форматам (DOCX/XML)?
Проект включает анализ стресса и эмоционального напряжения.
Как вы подходите к валидации моделей, предсказывающих психоэмоциональные маркеры на основе признаков eGeMAPS? Как вы боретесь с шумом и индивидуальными особенностями голоса спикеров?
Похожие вакансии
Архитектор мультиагентных систем на базе LLM
Аналитик AI-агентов Senior
Аналитик AI-агентов
Python-разработчик (AI)
Middle/Senior AI-разработчик
Python-разработчик в команду LLM платформы
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!