- Страна
- Россия
Откликайтесь
на вакансии с ИИ

ML-инженер/ Data Scientist (Проект по ИИ)
Актуальный технологический стек (LLM, RAG, мультимодальные модели) и возможность удаленной работы делают вакансию очень привлекательной для специалистов в области ИИ. Четко прописанные требования к инструментам свидетельствуют о зрелости проекта.
Сложность вакансии
Роль требует глубоких знаний в области LLM, RAG и деплоя (Kubernetes/Docker), а также владения специфическими техниками оптимизации инференса. Грейд Middle+ подразумевает наличие самостоятельного опыта реализации сложных ML-пайплайнов.
Анализ зарплаты
Зарплата в объявлении не указана, однако для уровня Middle/Middle+ в сфере ML/LLM рыночные предложения в России и при работе на зарубежные проекты обычно находятся в диапазоне от 250 000 до 450 000 рублей. Данный стек технологий является одним из самых высокооплачиваемых на текущем рынке.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Если вы готовы внедрять передовые LLM-решения и работать с полным циклом RAG, откликайтесь прямо сейчас!
Описание вакансии
#DS #DataScience #datascientist #Москва #удаленно #remote #ML
Открыта позиция ML-инженер/ Data Scientist (Проект по ИИ).
Уверенное владение Python.
Деплой: ML/LLM решения, Docker, Kubernetes, облачные платформы (AWS/GCP/Azure).
Prompt Engineering: few-shot, chain-of-thought, ReAct.
Fine‑tuning / PEFT: LoRA, QLoRA, adapters.
RAG: полный пайплайн (chunking → embedding → retrieval → генерация)
Векторные БД: Qdrant / Pinecone / Milvus / FAISS.
RLHF или синтетические данные: предпочтения / генерация и фильтрация.
Фреймворки: LangChain / LlamaIndex/ Hugging Face.
Оценка LLM: BLEU, ROUGE, MMLU, кастомные эвалы.
Оптимизация инференса: vLLM / TensorRT / ONNX.
Опыт работы с мультимодальными моделями (LLaVA, GPT-4V, Qwen-VL).
Грейд Middle/ Middle+
Полная занятость, удаленный формат работы.
Писать в ТГ Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- AWS
- Azure
- Python
- GCP
- Kubernetes
- LoRA
- RAG
- Prompt Engineering
- Docker
- LangChain
- Pinecone
- FAISS
- GPT-4V
- TensorRT
- RLHF
- Hugging Face
- Milvus
- LlamaIndex
- ONNX
- vLLM
- Qdrant
- QLoRA
Возможные вопросы на собеседовании
Проверка практического опыта работы с RAG-системами.
Расскажите, как вы подходите к выбору стратегии чанкинга и эмбеддингов для RAG-пайплайна в зависимости от типа данных?
Оценка навыков оптимизации моделей для продакшена.
Какие методы оптимизации инференса (vLLM, TensorRT) вы использовали и каких результатов удалось достичь в плане задержки (latency)?
Проверка знаний современных методов дообучения.
В каких случаях вы бы предпочли использование LoRA/QLoRA вместо полного дообучения модели (Full Fine-tuning)?
Оценка навыков работы с инфраструктурой.
Опишите ваш опыт деплоя ML-решений в Kubernetes: с какими основными сложностями вы сталкивались при масштабировании LLM?
Проверка понимания методологий промпт-инжиниринга.
Можете ли вы привести пример задачи, где подход Chain-of-Thought показал значительное преимущество перед обычным Zero-shot промптингом?
Похожие вакансии
ML разработчик (Middle)
ML разработчик Middle Middle+
Разработчик MLOps (Python)
Data инженер Middle+
Middle Data Science (Проект Альфа)
Data Engineer Python (Middle)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!