Страна: Казахстан
Зарплата: от 1 000 000 ₽

+500% приглашений

Откликайтесь
на вакансии с ИИ

SeniorГибридПолная занятость

Senior NLP Engineer

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Вакансия предлагает работу над сложным и инновационным продуктом в сфере LegalTech с использованием современного стека (LLM, ASR, Multimodal). Четко прописанные задачи и конкурентная заработная плата делают предложение очень привлекательным для опытных инженеров.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует исключительной экспертизы на стыке NLP, ASR и мультимодального анализа, включая работу с просодическими признаками и юридическими онтологиями. Высокая сложность обусловлена необходимостью оптимизации моделей под специфическое оборудование (Jetson) и глубоким пониманием специфики казахского языка.

Анализ зарплаты

Медиана250 000 ₽

Рынок200 000 ₽ – 350 000 ₽

Предложенная зарплата от 1 000 000 тенге является конкурентной для рынка Казахстана, однако для позиции уровня Senior в области AI/NLP с такими глубокими требованиями к мультимодальности и оптимизации, она находится ближе к нижней границе рыночного диапазона для топ-специалистов. В международных компаниях или крупных финтех-структурах региона вознаграждение может быть выше.

Меня крайне заинтересовала вакансия Senior NLP Engineer в «Виктори-Технолоджи», особенно масштаб задач по созданию мультимодального fusion-слоя и работе с юридическим доменом Казахстана. Мой опыт в разработке LLM-пайплайнов, файнтюнинге моделей (LoRA/QLoRA) и построении сложных RAG-систем полностью соответствует вашим требованиям к Stage 1 и Stage 2 разработке.

Я имею практический опыт работы с ASR-моделями, включая Whisper, и оптимизацией инференса через ONNX/TensorRT, что критично для ваших задач по развертыванию на Jetson. Кроме того, я глубоко знаком с методами минимизации галлюцинаций и оценки качества генерации (LLM-eval), что позволит мне эффективно решать задачи по автоматизации compliance-проверок и генерации структурированных документов. Буду рад обсудить, как мой опыт в NLP и анализе аудио-признаков поможет вашей команде в реализации инновационных LegalTech решений.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Виктори-Технолоджи уже сейчас

Если вы готовы создавать передовые мультимодальные системы на стыке NLP и анализа эмоций, откликайтесь прямо сейчас!

Описание вакансии

#вакансия #астана #гибрид #workITkz #dsml

Должность: Senior NLP Engineer

Компания: Виктори-Технолоджи

https://victech.kz

Город: Астана

Занятость: гибрид

Оплата: от 1 000 000 тг.

Описание вакансии:

Обязанности:

-Разработка и развитие LLM-пайплайна Stage 1: cleanup транскриптов после диаризации (Sortformer + Whisper Large V3), автоматическое определение ролей спикеров и флагирование значимых событий в диалоге;

- Разработка и развитие LLM-пайплайна Stage 2: автогенерация структурированных документов в форматах DOCX/XML для backend-системы редактирования и многоступенчатая compliance-проверка по доменным правилам (~30+ нормативных требований);

- Файнтюнинг и prompt-инженерия LLM (gpt-class и open-weight моделей) под доменную задачу на казахском и русском языках; снижение hallucination rate и стабилизация выводов между запусками;

- NER в доменных текстах: участники диалога, действия, временные и пространственные метки, нормативные ссылки;

- Семантическая сегментация транскриптов: разбиение на смысловые эпизоды и выделение ключевых моментов (формальные процедуры, ходатайства, паузы, вопрос–ответ);

- Разработка eval-методик и regression-тестов LLM-выводов; ведение бенчмарков моделей (accuracy по доменным правилам, false-positive / false-negative, стабильность между запусками);

- Создание LLM-агента, который интерпретирует поведенческие и эмоциональные сигналы от CV- и Audio-модулей и формирует связный текст аналитического характера для конечного пользователя;

- Работа с юридическими онтологиями и нормативными источниками: УПК РК (в т.ч. статьи 68, 77, 115), УК РК, Конституция РК; поддержка актуальности базы знаний при изменениях законодательства;

- Дообучение и оптимизация ASR-моделей (Whisper Large V3, Sortformer V4 для диаризации) на казахском и русском языках с адаптацией под акустику целевого помещения, фоновые шумы, региональные акценты и доменную лексику; экспорт ONNX/TensorRT и развёртывание на Jetson;

- Разработка пайплайна извлечения аудио-просодических признаков (F0/pitch, jitter, shimmer, intensity, speech rate, паузы, voice quality, eGeMAPS) и моделирование на их основе психоэмоциональных маркеров (стресс, неуверенность, эмоциональное напряжение);

- Разработка финального мультимодального fusion-слоя: интеграция текстовых эмбеддингов (NLP), аудио-просодических признаков и визуальных сигналов от CV-модуля (мимика, микродвижения, поза) в единую интерпретацию психоэмоционального состояния спикера;

- Формирование итоговых аналитических выводов для конечного пользователя в виде структурированных мультимодальных аннотаций: фрагмент диалога с просодическим контекстом и поведенческими маркерами, ранжирование моментов по уровню значимости с указанием уровня уверенности модели.

Требования:

- 3+ года в NLP/LLM; опыт production-проектов с end-to-end LLM-пайплайнами;

- Глубокое знание архитектур трансформеров и LLM; опыт файнтюнинга (LoRA / QLoRA / SFT) и instruction tuning под доменные задачи;

- Уверенное владение HuggingFace Transformers, vLLM, llama.cpp; опыт inference-оптимизации (квантование, batching, KV-cache); работа с локально развёрнутыми моделями;

- Глубокие навыки построения RAG: chunking-стратегии, векторные БД (pgvector / FAISS / Pinecone), reranking, мультиязычные embeddings (включая казахский);

- Опыт минимизации галлюцинаций: structured outputs, guardrails, constrained decoding; ведение LLM-eval (ragas, LangSmith и аналоги);

- Опыт промышленной разработки на Python (FastAPI / Flask, Docker, Git); понимание юридического домена и работы с KZ/RU языками;

- Опыт дообучения ASR-моделей (Whisper / wav2vec2 / Sortformer) на доменных данных; работа с диаризацией спикеров, спикер-эмбеддингами и шумоподавлением;

- Практический опыт извлечения и моделирования аудио-просодических и paralinguistic-признаков (librosa, openSMILE, parselmouth / Praat, eGeMAPS); понимание акустических коррелятов эмоций и стресса;

- Опыт мультимодального fusion (early / late / hybrid fusion, cross-modal attention); работа с Audio Transformers (AST, HuBERT, wav2vec2) и multimodal LLM.

- Проекты в области LegalTech и цифровизации;

- Живые задачи, быстрые решения и пространство для инициативы;

- Оформление в штат, испытательный срок 3 месяца;

- График: 5/2, 9:00–18:00.

Контакты:

Telegram Откликнуться

Whatsapp 87077111920

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

NLP
LLM
Python
FastAPI
Flask
Docker
Git
HuggingFace Transformers
vLLM
llama.cpp
Whisper
ASR
RAG
ONNX
TensorRT
PyTorch
PostgreSQL
FAISS
Pinecone
NER
Prompt Engineering
LoRA
QLoRA

Возможные вопросы на собеседовании

Вакансия предполагает работу с юридическими текстами на казахском и русском языках. Важно понять, как кандидат справляется с нехваткой данных или спецификой морфологии.

Расскажите о вашем опыте адаптации NLP-моделей и эмбеддингов для казахского языка. С какими основными трудностями вы сталкивались при работе с этим языком в задачах NER и RAG?

В описании указано использование Whisper и Sortformer с развертыванием на Jetson. Это требует навыков оптимизации.

Какие стратегии оптимизации ASR-моделей для работы в реальном времени на edge-устройствах (например, NVIDIA Jetson) вы использовали? Как вы балансируете между точностью и задержкой (latency)?

Одной из ключевых задач является интеграция текстовых, аудио и визуальных сигналов.

Опишите ваш подход к реализации мультимодального fusion-слоя. В каких случаях вы бы предпочли early fusion перед late fusion при объединении текстовых эмбеддингов и аудио-просодических признаков?

Для LegalTech критически важна точность и отсутствие галлюцинаций.

Какие методы constrained decoding и guardrails вы применяли на практике для обеспечения строгого соответствия LLM-вывода заданным нормативным требованиям и форматам (DOCX/XML)?

Проект включает анализ стресса и эмоционального напряжения.

Как вы подходите к валидации моделей, предсказывающих психоэмоциональные маркеры на основе признаков eGeMAPS? Как вы боретесь с шумом и индивидуальными особенностями голоса спикеров?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Казахстанот 1 000 000 ₽

Откликайтесь
на вакансии с ИИ

Senior NLP Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Виктори-Технолоджи уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие методы constrained decoding и guardrails вы применяли на практике для обеспечения строгого соответствия LLM-вывода заданным нормативным требованиям и форматам (DOCX/XML)?

Похожие вакансии

Архитектор мультиагентных систем на базе LLM

Аналитик AI-агентов Senior

Аналитик AI-агентов

Python-разработчик (AI)

Middle/Senior AI-разработчик

Python-разработчик в команду LLM платформы

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Senior NLP Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Виктори-Технолоджи уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие методы constrained decoding и guardrails вы применяли на практике для обеспечения строгого соответствия LLM-вывода заданным нормативным требованиям и форматам (DOCX/XML)?

Похожие вакансии

Архитектор мультиагентных систем на базе LLM

Аналитик AI-агентов Senior

Аналитик AI-агентов

Python-разработчик (AI)

Middle/Senior AI-разработчик

Python-разработчик в команду LLM платформы

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ