Страна: Узбекистан
Зарплата: 3 500 $ – 5 000 $

+500% приглашений

Откликайтесь
на вакансии с ИИ

УдалённоПолная занятость

ML-инженер (Speech/Audio)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Привлекательная вакансия с конкурентной зарплатой в долларах и работой над сложным технологическим продуктом. Из минусов — обязательный релокейт в Ташкент на первые месяцы, что может подойти не всем.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена необходимостью глубоких знаний в обработке аудиосигналов и умением интегрировать модели в C# бэкенд с жесткими требованиями к задержкам (latency). Требуется опыт работы с реальным продакшном и специфическими протоколами (SIP/RTP).

Анализ зарплаты

Медиана4 200 $

Рынок3 500 $ – 5 500 $

Предлагаемая вилка $3500–5000 соответствует верхнему сегменту рынка для Middle+/Senior ML-инженеров в СНГ и Восточной Европе, особенно учитывая специфику работы с аудио.

Меня заинтересовала вакансия ML-инженера в вашем VoIP-проекте, так как я обладаю опытом работы с аудио-данными и выводом моделей в продакшн. У меня есть практические навыки работы с ONNX Runtime и оптимизацией latency, что критично для real-time систем телефонии.

Я имею опыт работы с такими архитектурами, как Whisper и wav2vec, а также понимаю специфику обработки сигналов (MFCC, спектрограммы). Мой подход ориентирован на результат: от подготовки данных до калибровки моделей в условиях высокой нагрузки. Буду рад обсудить, как мой опыт поможет в развитии вашей системы Answering Machine Detection.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Если вы готовы внедрять ML-модели в высоконагруженный VoIP-продукт и работать с real-time аудио, отправляйте свое резюме прямо сейчас!

Описание вакансии

#ML #Production #ONNX #Remote

Компания: международный VoIP / Cloud Telephony продукт

Формат: гибрид (Ташкент 2–3 месяца → далее remote)

ЗП: $3500–5000 (обсуждается)

Строят высоконагруженную платформу облачной телефонии для США/Канады, где ML - core часть системы. Ищут ML-инженера, который умеет доводить speech/audio модели до production и отвечать за их работу в real-time.

Чем предстоит заниматься:

• Развитие AMD (Answering Machine Detection) в real-time звонках

• End-to-end ML: от разметки аудио до деплоя и калибровки в проде

• Интеграция моделей в backend (C# / SIP / RTP) через ONNX Runtime

• Оптимизация latency (стриминг аудио, работа с миллисекундами)

• Разбор edge cases и анализ ошибок в реальных звонках

R&D: VAD, noise suppression, speech models

Стек: Python, C#, wav2vec 2.0, Whisper, HuggingFace, MFCC, spectrograms, ONNX Runtime, quantization, SIP/RTP

Ожидают

• 2+ года ML в продакшене

• Опыт со Speech / Audio (ASR, VAD, audio classification)

• Умение работать end-to-end (data → inference)

• Понимание метрик и quality (Precision/Recall, ROC-AUC, calibration)

• Инженерный подход и работа с продом, а не только с экспериментами

Условия:

• Онбординг оффлайн в Ташкенте (2–3 месяца), затем remote

• Высоконагруженный production ML

• Сильная инженерная команда, минимум бюрократии

📩 CV в Telegram: Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
C++
ONNX Runtime
Whisper
Huggingface
ASR
VAD
SIP
RTP
Quantization
Audio Processing

Возможные вопросы на собеседовании

Проверка понимания специфики real-time обработки аудио.

Как вы будете минимизировать latency при инференсе тяжелых моделей типа Whisper в реальном времени?

Оценка навыков работы с ONNX и интеграции в другие стеки.

Расскажите о вашем опыте квантования моделей и использования ONNX Runtime для оптимизации производительности.

Проверка продуктового мышления и работы с метриками.

Как правильно калибровать порог срабатывания AMD (Answering Machine Detection), чтобы соблюсти баланс между Precision и Recall?

Технический вопрос по обработке сигналов.

В каких случаях использование MFCC предпочтительнее сырых аудиоданных для классификации аудио?

Проверка опыта работы с данными.

Как вы организуете процесс доразметки данных, если модель начинает ошибаться на специфических edge-кейсах в реальных звонках?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Узбекистанот 3 500 $

Откликайтесь
на вакансии с ИИ

ML-инженер (Speech/Audio)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Как вы будете минимизировать latency при инференсе тяжелых моделей типа Whisper в реальном времени?

Расскажите о вашем опыте квантования моделей и использования ONNX Runtime для оптимизации производительности.

Как правильно калибровать порог срабатывания AMD (Answering Machine Detection), чтобы соблюсти баланс между Precision и Recall?

В каких случаях использование MFCC предпочтительнее сырых аудиоданных для классификации аудио?

Как вы организуете процесс доразметки данных, если модель начинает ошибаться на специфических edge-кейсах в реальных звонках?

Похожие вакансии

Senior MLOps инженер

Team Lead Data Science / ML

MLOps инженер (Team Lead)

MLOps инженер (Тимлид)

Senior MLOps инженер

Senior Data Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

ML-инженер (Speech/Audio)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Как вы будете минимизировать latency при инференсе тяжелых моделей типа Whisper в реальном времени?

Расскажите о вашем опыте квантования моделей и использования ONNX Runtime для оптимизации производительности.

Как правильно калибровать порог срабатывания AMD (Answering Machine Detection), чтобы соблюсти баланс между Precision и Recall?

В каких случаях использование MFCC предпочтительнее сырых аудиоданных для классификации аудио?

Как вы организуете процесс доразметки данных, если модель начинает ошибаться на специфических edge-кейсах в реальных звонках?

Похожие вакансии

Senior MLOps инженер

Team Lead Data Science / ML

MLOps инженер (Team Lead)

MLOps инженер (Тимлид)

Senior MLOps инженер

Senior Data Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ