Откликайтесь
на вакансии с ИИ

ML Engineer (Edge AI / Mobile)
Это высокотехнологичная и актуальная позиция в сфере Edge AI, которая предлагает работу с передовым стеком (LLM, CoreML, ExecuTorch). Несмотря на отсутствие указанной зарплаты, узкая специализация делает вакансию очень привлекательной для профессионального роста.
Сложность вакансии
Роль требует глубокой экспертизы на стыке ML и мобильной разработки, включая специфические знания квантования и работы с нейронными процессорами (ANE, QNN). Найти специалиста с опытом оптимизации LLM именно под Edge-устройства — сложная задача.
Анализ зарплаты
Для позиции ML-инженера с такой узкой специализацией (Edge AI/Mobile) рыночные зарплаты обычно выше среднего по рынку ML из-за дефицита кадров. В России и СНГ такие специалисты могут рассчитывать на доход от 350 000 до 550 000 рублей в зависимости от глубины опыта с конкретным "железом".
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Если вы готовы оптимизировать LLM для мобильных устройств и работать с Edge AI, отправьте резюме Веронике прямо сейчас!
Описание вакансии
#vacancy #ML #Mobile
Вакансия для ML Engineer!
🌍 Локация: удалённо (к сожалению, не все страны доступны из-за юридических ограничений)
🇬🇧 Английский язык - B2.
💡 Чем ты будешь заниматься:
✳️ адаптировать LLM под Edge AI;
✳️применять квантование (INT4 / INT8 / FP8);
✳️запускать модели через CoreML, TFLite, ExecuTorch, llama.cpp;
✳️оптимизировать latency, нагрев и энергопотребление;
✳️ внедрять инференс прямо в мобильные приложения.
🧑💻 Мы ищем человека с опытом:
🔺 On-device / Mobile / Edge AI;
🔺Quantization, GGUF, llama.cpp;
🔺CoreML + Apple Neural Engine / TFLite / Qualcomm QNN;
➕ Будет плюсом:
🔺 ONNX Runtime (mobile);
🔺 KVCache, Flash Attention на мобилках;
🔺опыт с реальными устройствами (iPhone, Snapdragon, Pixel).
Пишите в личные сообщения / t.me: Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- LLM
- ONNX Runtime
- Edge AI
- TensorFlow Lite
- CoreML
- Quantization
- Flash Attention
- llama.cpp
- ExecuTorch
- Apple Neural Engine
- GGUF
- Qualcomm QNN
Возможные вопросы на собеседовании
Проверка практического опыта работы с форматами для мобильного инференса.
Расскажите о вашем опыте использования llama.cpp и GGUF: с какими основными трудностями вы сталкивались при запуске моделей на мобильных устройствах?
Важно понимать, как кандидат балансирует между точностью модели и её производительностью.
Как вы выбираете между INT4 и FP8 квантованием для конкретной задачи? Как это влияет на нагрев устройства и точность ответов LLM?
Проверка знаний специфических аппаратных ускорителей.
В чем заключаются особенности оптимизации моделей под Apple Neural Engine (ANE) по сравнению с обычным GPU инференсом в CoreML?
Оценка навыков работы с памятью, что критично для мобильных LLM.
Какие техники оптимизации KVCache вы применяли для работы LLM на устройствах с ограниченным объемом оперативной памяти?
Проверка владения английским языком на техническом уровне.
Could you describe a challenging technical problem you solved in Edge AI in English?
Похожие вакансии
ML разработчик (Senior)
Senior / Middle+ Data Scientist
MlOps / Python Backend Engineer (ML)
Data Scientist Senior
Senior/Middle Data Engineer
Senior Data Scientist
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!