yandex
Страна
Казахстан
Зарплата
от 1 000 000 ₽
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorГибридПолная занятость

Senior NLP Engineer

ИИОценка ИИ

Вакансия предлагает работу над сложным и инновационным продуктом в сфере LegalTech с использованием современного стека (LLM, ASR, Multimodal). Четко прописанные задачи и конкурентная заработная плата делают предложение очень привлекательным для опытных инженеров.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Роль требует исключительной экспертизы на стыке NLP, ASR и мультимодального анализа, включая работу с просодическими признаками и юридическими онтологиями. Высокая сложность обусловлена необходимостью оптимизации моделей под специфическое оборудование (Jetson) и глубоким пониманием специфики казахского языка.

Анализ зарплаты

Медиана250 000 ₽
Рынок200 000 ₽ – 350 000 ₽
ИИОценка ИИ

Предложенная зарплата от 1 000 000 тенге является конкурентной для рынка Казахстана, однако для позиции уровня Senior в области AI/NLP с такими глубокими требованиями к мультимодальности и оптимизации, она находится ближе к нижней границе рыночного диапазона для топ-специалистов. В международных компаниях или крупных финтех-структурах региона вознаграждение может быть выше.

Сопроводительное письмо

Меня крайне заинтересовала вакансия Senior NLP Engineer в «Виктори-Технолоджи», особенно масштаб задач по созданию мультимодального fusion-слоя и работе с юридическим доменом Казахстана. Мой опыт в разработке LLM-пайплайнов, файнтюнинге моделей (LoRA/QLoRA) и построении сложных RAG-систем полностью соответствует вашим требованиям к Stage 1 и Stage 2 разработке.

Я имею практический опыт работы с ASR-моделями, включая Whisper, и оптимизацией инференса через ONNX/TensorRT, что критично для ваших задач по развертыванию на Jetson. Кроме того, я глубоко знаком с методами минимизации галлюцинаций и оценки качества генерации (LLM-eval), что позволит мне эффективно решать задачи по автоматизации compliance-проверок и генерации структурированных документов. Буду рад обсудить, как мой опыт в NLP и анализе аудио-признаков поможет вашей команде в реализации инновационных LegalTech решений.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Виктори-Технолоджи уже сейчас

Если вы готовы создавать передовые мультимодальные системы на стыке NLP и анализа эмоций, откликайтесь прямо сейчас!

Описание вакансии

#вакансия #астана #гибрид #workITkz #dsml

Должность: Senior NLP Engineer

Компания: Виктори-Технолоджи

https://victech.kz

Город: Астана

Занятость: гибрид

Оплата: от 1 000 000 тг.

Описание вакансии:

Обязанности:

-Разработка и развитие LLM-пайплайна Stage 1: cleanup транскриптов после диаризации (Sortformer + Whisper Large V3), автоматическое определение ролей спикеров и флагирование значимых событий в диалоге;

- Разработка и развитие LLM-пайплайна Stage 2: автогенерация структурированных документов в форматах DOCX/XML для backend-системы редактирования и многоступенчатая compliance-проверка по доменным правилам (~30+ нормативных требований);

- Файнтюнинг и prompt-инженерия LLM (gpt-class и open-weight моделей) под доменную задачу на казахском и русском языках; снижение hallucination rate и стабилизация выводов между запусками;

- NER в доменных текстах: участники диалога, действия, временные и пространственные метки, нормативные ссылки;

- Семантическая сегментация транскриптов: разбиение на смысловые эпизоды и выделение ключевых моментов (формальные процедуры, ходатайства, паузы, вопрос–ответ);

- Разработка eval-методик и regression-тестов LLM-выводов; ведение бенчмарков моделей (accuracy по доменным правилам, false-positive / false-negative, стабильность между запусками);

- Создание LLM-агента, который интерпретирует поведенческие и эмоциональные сигналы от CV- и Audio-модулей и формирует связный текст аналитического характера для конечного пользователя;

- Работа с юридическими онтологиями и нормативными источниками: УПК РК (в т.ч. статьи 68, 77, 115), УК РК, Конституция РК; поддержка актуальности базы знаний при изменениях законодательства;

- Дообучение и оптимизация ASR-моделей (Whisper Large V3, Sortformer V4 для диаризации) на казахском и русском языках с адаптацией под акустику целевого помещения, фоновые шумы, региональные акценты и доменную лексику; экспорт ONNX/TensorRT и развёртывание на Jetson;

- Разработка пайплайна извлечения аудио-просодических признаков (F0/pitch, jitter, shimmer, intensity, speech rate, паузы, voice quality, eGeMAPS) и моделирование на их основе психоэмоциональных маркеров (стресс, неуверенность, эмоциональное напряжение);

- Разработка финального мультимодального fusion-слоя: интеграция текстовых эмбеддингов (NLP), аудио-просодических признаков и визуальных сигналов от CV-модуля (мимика, микродвижения, поза) в единую интерпретацию психоэмоционального состояния спикера;

- Формирование итоговых аналитических выводов для конечного пользователя в виде структурированных мультимодальных аннотаций: фрагмент диалога с просодическим контекстом и поведенческими маркерами, ранжирование моментов по уровню значимости с указанием уровня уверенности модели.

Требования:

- 3+ года в NLP/LLM; опыт production-проектов с end-to-end LLM-пайплайнами;

- Глубокое знание архитектур трансформеров и LLM; опыт файнтюнинга (LoRA / QLoRA / SFT) и instruction tuning под доменные задачи;

- Уверенное владение HuggingFace Transformers, vLLM, llama.cpp; опыт inference-оптимизации (квантование, batching, KV-cache); работа с локально развёрнутыми моделями;

- Глубокие навыки построения RAG: chunking-стратегии, векторные БД (pgvector / FAISS / Pinecone), reranking, мультиязычные embeddings (включая казахский);

- Опыт минимизации галлюцинаций: structured outputs, guardrails, constrained decoding; ведение LLM-eval (ragas, LangSmith и аналоги);

- Опыт промышленной разработки на Python (FastAPI / Flask, Docker, Git); понимание юридического домена и работы с KZ/RU языками;

- Опыт дообучения ASR-моделей (Whisper / wav2vec2 / Sortformer) на доменных данных; работа с диаризацией спикеров, спикер-эмбеддингами и шумоподавлением;

- Практический опыт извлечения и моделирования аудио-просодических и paralinguistic-признаков (librosa, openSMILE, parselmouth / Praat, eGeMAPS); понимание акустических коррелятов эмоций и стресса;

- Опыт мультимодального fusion (early / late / hybrid fusion, cross-modal attention); работа с Audio Transformers (AST, HuBERT, wav2vec2) и multimodal LLM.

- Проекты в области LegalTech и цифровизации;

- Живые задачи, быстрые решения и пространство для инициативы;

- Оформление в штат, испытательный срок 3 месяца;

- График: 5/2, 9:00–18:00.

Контакты:

Whatsapp 87077111920

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • NLP
  • LLM
  • Python
  • FastAPI
  • Flask
  • Docker
  • Git
  • HuggingFace Transformers
  • vLLM
  • llama.cpp
  • Whisper
  • ASR
  • RAG
  • ONNX
  • TensorRT
  • PyTorch
  • PostgreSQL
  • FAISS
  • Pinecone
  • NER
  • Prompt Engineering
  • LoRA
  • QLoRA

Возможные вопросы на собеседовании

Вакансия предполагает работу с юридическими текстами на казахском и русском языках. Важно понять, как кандидат справляется с нехваткой данных или спецификой морфологии.

Расскажите о вашем опыте адаптации NLP-моделей и эмбеддингов для казахского языка. С какими основными трудностями вы сталкивались при работе с этим языком в задачах NER и RAG?

В описании указано использование Whisper и Sortformer с развертыванием на Jetson. Это требует навыков оптимизации.

Какие стратегии оптимизации ASR-моделей для работы в реальном времени на edge-устройствах (например, NVIDIA Jetson) вы использовали? Как вы балансируете между точностью и задержкой (latency)?

Одной из ключевых задач является интеграция текстовых, аудио и визуальных сигналов.

Опишите ваш подход к реализации мультимодального fusion-слоя. В каких случаях вы бы предпочли early fusion перед late fusion при объединении текстовых эмбеддингов и аудио-просодических признаков?

Для LegalTech критически важна точность и отсутствие галлюцинаций.

Какие методы constrained decoding и guardrails вы применяли на практике для обеспечения строгого соответствия LLM-вывода заданным нормативным требованиям и форматам (DOCX/XML)?

Проект включает анализ стресса и эмоционального напряжения.

Как вы подходите к валидации моделей, предсказывающих психоэмоциональные маркеры на основе признаков eGeMAPS? Как вы боретесь с шумом и индивидуальными особенностями голоса спикеров?

Похожие вакансии

T
TopSelection
400 000 ₽ – 450 000 ₽

Архитектор мультиагентных систем на базе LLM

SeniorУдалённо
LLM · Kafka · Kubernetes · LangChain · RabbitMQ · Docker · LlamaIndex · GPU · ML · Big Data · ERP
+11 навыков
NDA
от 1 700 ₽

Аналитик AI-агентов Senior

SeniorУдалённо
Python · LangChain · LangGraph · Machine Learning · Docker · Kubernetes · Helm · Jira · Confluence · Git · Jenkins · Agile · Scrum
+13 навыков
J
JETLYN
220 000 ₽ – 280 000 ₽

Аналитик AI-агентов

SeniorУдалённо
Python · LangChain · LangGraph · Machine Learning · Docker · Kubernetes · Helm · Confluence · Jira · Git · Jenkins · Agile · Scrum · LLM
+14 навыков
J
JETLYN
220 000 ₽ – 280 000 ₽

Python-разработчик (AI)

SeniorУдалённо
Python · FastAPI · LLM · RAG · LangChain · LangGraph · LlamaIndex · PostgreSQL · Redis · Kafka · NATS · Docker · Kubernetes · CI/CD · gRPC · REST API · asyncio
+17 навыков
O
OFai
от 200 000 ₽

Middle/Senior AI-разработчик

SeniorУдалённо
Generative AI · Stable Diffusion · Python · Machine Learning · Computer Vision · Web Development
+6 навыков
Т
Т-Банк
Не указана

Python-разработчик в команду LLM платформы

SeniorУдалённо
Python · FastAPI · PostgreSQL · Docker · Kubernetes · PyTest · LLM · Machine Learning
+8 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Казахстанот 1 000 000 ₽