Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

MiddleУдалённоПолная занятость

ML-инженер/ Data Scientist (Проект по ИИ)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Актуальный технологический стек (LLM, RAG, мультимодальные модели) и возможность удаленной работы делают вакансию очень привлекательной для специалистов в области ИИ. Четко прописанные требования к инструментам свидетельствуют о зрелости проекта.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует глубоких знаний в области LLM, RAG и деплоя (Kubernetes/Docker), а также владения специфическими техниками оптимизации инференса. Грейд Middle+ подразумевает наличие самостоятельного опыта реализации сложных ML-пайплайнов.

Анализ зарплаты

Медиана350 000 ₽

Рынок250 000 ₽ – 450 000 ₽

Зарплата в объявлении не указана, однако для уровня Middle/Middle+ в сфере ML/LLM рыночные предложения в России и при работе на зарубежные проекты обычно находятся в диапазоне от 250 000 до 450 000 рублей. Данный стек технологий является одним из самых высокооплачиваемых на текущем рынке.

Меня крайне заинтересовала вакансия ML-инженера в вашем проекте по ИИ. Мой опыт работы с Python и современным стеком LLM (LangChain, Hugging Face) позволяет мне эффективно решать задачи по деплою и оптимизации моделей. Я обладаю практическими навыками настройки RAG-пайплайнов и работы с векторными базами данных, такими как Qdrant и FAISS.

Особый интерес вызывает возможность применения техник Fine-tuning (LoRA/QLoRA) и оптимизации инференса через vLLM. Я уверен, что мой опыт в Prompt Engineering и деплое моделей в Docker/Kubernetes принесет значительную пользу вашему проекту. Буду рад обсудить, как мои навыки помогут в развитии ваших ИИ-продуктов.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Если вы готовы внедрять передовые LLM-решения и работать с полным циклом RAG, откликайтесь прямо сейчас!

Описание вакансии

#DS #DataScience #datascientist #Москва #удаленно #remote #ML

Открыта позиция ML-инженер/ Data Scientist (Проект по ИИ).

Уверенное владение Python.

Деплой: ML/LLM решения, Docker, Kubernetes, облачные платформы (AWS/GCP/Azure).

Prompt Engineering: few-shot, chain-of-thought, ReAct.

Fine‑tuning / PEFT: LoRA, QLoRA, adapters.

RAG: полный пайплайн (chunking → embedding → retrieval → генерация)

Векторные БД: Qdrant / Pinecone / Milvus / FAISS.

RLHF или синтетические данные: предпочтения / генерация и фильтрация.

Фреймворки: LangChain / LlamaIndex/ Hugging Face.

Оценка LLM: BLEU, ROUGE, MMLU, кастомные эвалы.

Оптимизация инференса: vLLM / TensorRT / ONNX.

Опыт работы с мультимодальными моделями (LLaVA, GPT-4V, Qwen-VL).

Грейд Middle/ Middle+

Полная занятость, удаленный формат работы.

Писать в ТГ Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
Docker
Kubernetes
AWS
GCP
Azure
Prompt Engineering
LoRA
QLoRA
RAG
Qdrant
Pinecone
Milvus
FAISS
RLHF
LangChain
LlamaIndex
Hugging Face
vLLM
TensorRT
ONNX
GPT-4V

Возможные вопросы на собеседовании

Проверка практического опыта работы с RAG-системами.

Расскажите, как вы подходите к выбору стратегии чанкинга и эмбеддингов для RAG-пайплайна в зависимости от типа данных?

Оценка навыков оптимизации моделей для продакшена.

Какие методы оптимизации инференса (vLLM, TensorRT) вы использовали и каких результатов удалось достичь в плане задержки (latency)?

Проверка знаний современных методов дообучения.

В каких случаях вы бы предпочли использование LoRA/QLoRA вместо полного дообучения модели (Full Fine-tuning)?

Оценка навыков работы с инфраструктурой.

Опишите ваш опыт деплоя ML-решений в Kubernetes: с какими основными сложностями вы сталкивались при масштабировании LLM?

Проверка понимания методологий промпт-инжиниринга.

Можете ли вы привести пример задачи, где подход Chain-of-Thought показал значительное преимущество перед обычным Zero-shot промптингом?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

ML-инженер/ Data Scientist (Проект по ИИ)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите, как вы подходите к выбору стратегии чанкинга и эмбеддингов для RAG-пайплайна в зависимости от типа данных?

Какие методы оптимизации инференса (vLLM, TensorRT) вы использовали и каких результатов удалось достичь в плане задержки (latency)?

В каких случаях вы бы предпочли использование LoRA/QLoRA вместо полного дообучения модели (Full Fine-tuning)?

Опишите ваш опыт деплоя ML-решений в Kubernetes: с какими основными сложностями вы сталкивались при масштабировании LLM?

Можете ли вы привести пример задачи, где подход Chain-of-Thought показал значительное преимущество перед обычным Zero-shot промптингом?

Похожие вакансии

Data engineer

MLOps-инженер

Data Engineer / Big Data Developer

Data инженер Middle

Data engineer

Middle+ Data инженер

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

ML-инженер/ Data Scientist (Проект по ИИ)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите, как вы подходите к выбору стратегии чанкинга и эмбеддингов для RAG-пайплайна в зависимости от типа данных?

Какие методы оптимизации инференса (vLLM, TensorRT) вы использовали и каких результатов удалось достичь в плане задержки (latency)?

В каких случаях вы бы предпочли использование LoRA/QLoRA вместо полного дообучения модели (Full Fine-tuning)?

Опишите ваш опыт деплоя ML-решений в Kubernetes: с какими основными сложностями вы сталкивались при масштабировании LLM?

Можете ли вы привести пример задачи, где подход Chain-of-Thought показал значительное преимущество перед обычным Zero-shot промптингом?

Похожие вакансии

Data engineer

MLOps-инженер

Data Engineer / Big Data Developer

Data инженер Middle

Data engineer

Middle+ Data инженер

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ