+500% приглашений

Откликайтесь
на вакансии с ИИ

Удалённо

ML Engineer (Edge AI / Mobile)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Это высокотехнологичная и актуальная позиция в сфере Edge AI, которая предлагает работу с передовым стеком (LLM, CoreML, ExecuTorch). Несмотря на отсутствие указанной зарплаты, узкая специализация делает вакансию очень привлекательной для профессионального роста.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует глубокой экспертизы на стыке ML и мобильной разработки, включая специфические знания квантования и работы с нейронными процессорами (ANE, QNN). Найти специалиста с опытом оптимизации LLM именно под Edge-устройства — сложная задача.

Анализ зарплаты

Медиана450 000 ₽

Рынок350 000 ₽ – 600 000 ₽

Для позиции ML-инженера с такой узкой специализацией (Edge AI/Mobile) рыночные зарплаты обычно выше среднего по рынку ML из-за дефицита кадров. В России и СНГ такие специалисты могут рассчитывать на доход от 350 000 до 550 000 рублей в зависимости от глубины опыта с конкретным "железом".

Меня крайне заинтересовала вакансия ML Engineer, ориентированная на Edge AI и мобильную разработку. У меня есть опыт работы с квантованием моделей (INT8/FP8) и их адаптацией под ограниченные ресурсы мобильных устройств, что идеально совпадает с вашими задачами по оптимизации latency и энергопотребления.

Я хорошо знаком с инструментами CoreML и llama.cpp, а также имею опыт работы с Apple Neural Engine. Уверен, что мои навыки в области On-device AI помогут вашей команде эффективно внедрять современные LLM-решения непосредственно в мобильные приложения, обеспечивая высокую производительность на устройствах пользователей.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Если вы готовы оптимизировать LLM для мобильных устройств и работать с Edge AI, отправьте резюме Веронике прямо сейчас!

Описание вакансии

#vacancy #ML #Mobile

Вакансия для ML Engineer!

🌍 Локация: удалённо (к сожалению, не все страны доступны из-за юридических ограничений)

🇬🇧 Английский язык - B2.

💡 Чем ты будешь заниматься:

✳️ адаптировать LLM под Edge AI;

✳️применять квантование (INT4 / INT8 / FP8);

✳️запускать модели через CoreML, TFLite, ExecuTorch, llama.cpp;

✳️оптимизировать latency, нагрев и энергопотребление;

✳️ внедрять инференс прямо в мобильные приложения.

🧑‍💻 Мы ищем человека с опытом:

🔺 On-device / Mobile / Edge AI;

🔺Quantization, GGUF, llama.cpp;

🔺CoreML + Apple Neural Engine / TFLite / Qualcomm QNN;

➕ Будет плюсом:

🔺 ONNX Runtime (mobile);

🔺 KVCache, Flash Attention на мобилках;

🔺опыт с реальными устройствами (iPhone, Snapdragon, Pixel).

Пишите в личные сообщения / t.me: Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

LLM
Edge AI
Quantization
CoreML
TensorFlow Lite
ExecuTorch
llama.cpp
GGUF
Apple Neural Engine
Qualcomm QNN
ONNX Runtime
Flash Attention

Возможные вопросы на собеседовании

Проверка практического опыта работы с форматами для мобильного инференса.

Расскажите о вашем опыте использования llama.cpp и GGUF: с какими основными трудностями вы сталкивались при запуске моделей на мобильных устройствах?

Важно понимать, как кандидат балансирует между точностью модели и её производительностью.

Как вы выбираете между INT4 и FP8 квантованием для конкретной задачи? Как это влияет на нагрев устройства и точность ответов LLM?

Проверка знаний специфических аппаратных ускорителей.

В чем заключаются особенности оптимизации моделей под Apple Neural Engine (ANE) по сравнению с обычным GPU инференсом в CoreML?

Оценка навыков работы с памятью, что критично для мобильных LLM.

Какие техники оптимизации KVCache вы применяли для работы LLM на устройствах с ограниченным объемом оперативной памяти?

Проверка владения английским языком на техническом уровне.

Could you describe a challenging technical problem you solved in Edge AI in English?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Откликайтесь
на вакансии с ИИ

ML Engineer (Edge AI / Mobile)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте использования llama.cpp и GGUF: с какими основными трудностями вы сталкивались при запуске моделей на мобильных устройствах?

Как вы выбираете между INT4 и FP8 квантованием для конкретной задачи? Как это влияет на нагрев устройства и точность ответов LLM?

В чем заключаются особенности оптимизации моделей под Apple Neural Engine (ANE) по сравнению с обычным GPU инференсом в CoreML?

Какие техники оптимизации KVCache вы применяли для работы LLM на устройствах с ограниченным объемом оперативной памяти?

Could you describe a challenging technical problem you solved in Edge AI in English?

Похожие вакансии

Senior MLOps инженер

Team Lead Data Science / ML

MLOps инженер (Team Lead)

MLOps инженер (Тимлид)

Senior MLOps инженер

Senior Data Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

ML Engineer (Edge AI / Mobile)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте использования llama.cpp и GGUF: с какими основными трудностями вы сталкивались при запуске моделей на мобильных устройствах?

Как вы выбираете между INT4 и FP8 квантованием для конкретной задачи? Как это влияет на нагрев устройства и точность ответов LLM?

В чем заключаются особенности оптимизации моделей под Apple Neural Engine (ANE) по сравнению с обычным GPU инференсом в CoreML?

Какие техники оптимизации KVCache вы применяли для работы LLM на устройствах с ограниченным объемом оперативной памяти?

Could you describe a challenging technical problem you solved in Edge AI in English?

Похожие вакансии

Senior MLOps инженер

Team Lead Data Science / ML

MLOps инженер (Team Lead)

MLOps инженер (Тимлид)

Senior MLOps инженер

Senior Data Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ