- Страна
- Узбекистан
- Зарплата
- 3 500 $ – 5 000 $
Откликайтесь
на вакансии с ИИ

ML-инженер (Speech/Audio)
Привлекательная вакансия с конкурентной зарплатой в долларах и работой над сложным технологическим продуктом. Из минусов — обязательный релокейт в Ташкент на первые месяцы, что может подойти не всем.
Сложность вакансии
Высокая сложность обусловлена необходимостью глубоких знаний в обработке аудиосигналов и умением интегрировать модели в C# бэкенд с жесткими требованиями к задержкам (latency). Требуется опыт работы с реальным продакшном и специфическими протоколами (SIP/RTP).
Анализ зарплаты
Предлагаемая вилка $3500–5000 соответствует верхнему сегменту рынка для Middle+/Senior ML-инженеров в СНГ и Восточной Европе, особенно учитывая специфику работы с аудио.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Если вы готовы внедрять ML-модели в высоконагруженный VoIP-продукт и работать с real-time аудио, отправляйте свое резюме прямо сейчас!
Описание вакансии
#ML #Production #ONNX #Remote
Компания: международный VoIP / Cloud Telephony продукт
Формат: гибрид (Ташкент 2–3 месяца → далее remote)
ЗП: $3500–5000 (обсуждается)
Строят высоконагруженную платформу облачной телефонии для США/Канады, где ML - core часть системы. Ищут ML-инженера, который умеет доводить speech/audio модели до production и отвечать за их работу в real-time.
Чем предстоит заниматься:
• Развитие AMD (Answering Machine Detection) в real-time звонках
• End-to-end ML: от разметки аудио до деплоя и калибровки в проде
• Интеграция моделей в backend (C# / SIP / RTP) через ONNX Runtime
• Оптимизация latency (стриминг аудио, работа с миллисекундами)
• Разбор edge cases и анализ ошибок в реальных звонках
R&D: VAD, noise suppression, speech models
Стек: Python, C#, wav2vec 2.0, Whisper, HuggingFace, MFCC, spectrograms, ONNX Runtime, quantization, SIP/RTP
Ожидают
• 2+ года ML в продакшене
• Опыт со Speech / Audio (ASR, VAD, audio classification)
• Умение работать end-to-end (data → inference)
• Понимание метрик и quality (Precision/Recall, ROC-AUC, calibration)
• Инженерный подход и работа с продом, а не только с экспериментами
Условия:
• Онбординг оффлайн в Ташкенте (2–3 месяца), затем remote
• Высоконагруженный production ML
• Сильная инженерная команда, минимум бюрократии
📩 CV в Telegram: Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- C++
- Python
- ONNX Runtime
- Huggingface
- SIP
- RTP
- Audio Processing
- ASR
- VAD
- Quantization
- Whisper
Возможные вопросы на собеседовании
Проверка понимания специфики real-time обработки аудио.
Как вы будете минимизировать latency при инференсе тяжелых моделей типа Whisper в реальном времени?
Оценка навыков работы с ONNX и интеграции в другие стеки.
Расскажите о вашем опыте квантования моделей и использования ONNX Runtime для оптимизации производительности.
Проверка продуктового мышления и работы с метриками.
Как правильно калибровать порог срабатывания AMD (Answering Machine Detection), чтобы соблюсти баланс между Precision и Recall?
Технический вопрос по обработке сигналов.
В каких случаях использование MFCC предпочтительнее сырых аудиоданных для классификации аудио?
Проверка опыта работы с данными.
Как вы организуете процесс доразметки данных, если модель начинает ошибаться на специфических edge-кейсах в реальных звонках?
Похожие вакансии
ML разработчик (Senior)
Senior / Middle+ Data Scientist
MlOps / Python Backend Engineer (ML)
Data Scientist Senior
Senior/Middle Data Engineer
Senior Data Scientist
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Узбекистан
- Зарплата
- 3 500 $ – 5 000 $