- Страна
- Россия
Откликайтесь
на вакансии с ИИ

Senior LLM Engineer
Отличная позиция для Senior-специалиста: работа с современным стеком (GenAI, GPU-кластеры), сильная команда и прямой доступ к реальным бизнес-кейсам крупного банка. Высокий уровень доверия к вакансии и наличие ресурсов (GPU, бюджет) делают её крайне привлекательной.
Сложность вакансии
Роль требует глубокой экспертизы не только в ML, но и в инфраструктурных вопросах (K8s, Docker), а также специфического опыта с LLM-агентами и RAG в условиях крупного энтерпрайза. Высокая планка ожиданий по оптимизации стоимости и latency инференса.
Анализ зарплаты
В вакансии не указана вилка, однако для позиции Senior LLM Engineer в Москве в банковском секторе рыночные предложения обычно начинаются от 400 000 рублей net. Учитывая комментарий о 'высоком доверии' и наличии бюджета, можно ожидать компенсацию на уровне или выше верхней границы рынка.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Присоединяйтесь к CIB LLM Team и создавайте AI-платформу будущего для крупнейшего корпоративного бизнеса!
Описание вакансии
tldr: Senior LLM Engineer в крупный банк. Внутренняя AI Platform, open-source LLM, агенты/RAG. Гибрид, Москва.
[вилки нет, но вакансия прошла голосование на высоком доверии к автору, деньги есть]
Мы в команде CIB LLM Team отвечаем за AI Platform для корпоративного бизнеса банка: LLM API Gateway, AI Chat, агентные решения, инфраструктуру для моделей и агентов, инструменты для создания AI-продуктов.
Ищем LLM-инженера, который усилит нашу команду в направлении внутренних AI-продуктов, агентов, RAG и оптимизации инференса.
Что делать:
\* отвечать за внутреннюю AI Platform и инструменты для AI-приложений;
\* проектировать агентов для автоматизации бизнес-процессов;
\* работать с RAG, tool calling и корпоративными знаниями;
\* оптимизировать качество, стоимость и latency инференса;
\* участвовать в выборе и эксплуатации open-source LLM;
\* доводить гипотезы и прототипы до production.
Что важно:
\* уверенный Python;
\* опыт ML/DL от 2 лет;
\* понимание современных LLM/NLP/GenAI;
\* опыт production-систем на базе LLM;
\* понимание retrieval, routing, tool calling, memory, evaluation;
\* опыт с Docker/Kubernetes и микросервисной архитектурой.
Будет плюсом:
\* глубокое понимание эвалов для LLM-систем;
\* опыт в self-hosted инференсе;
\* опыт промышленной разработки.
Мы предлагаем:
\* возможность работать над AI Platform для крупного корпоративного бизнеса;
\* работу над продуктами, которыми ежедневно пользуются сотрудники банка;
\* сильную инженерную команду, автономность и влияние на архитектуру;
\* возможность работать с современными open-source моделями и GPU-кластером;
\* ДМС, обучение, конференции, гибрид и офис в центре Москвы.
Откликнуться: присылайте резюме Камиле — Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- Machine Learning
- Deep Learning
- LLM
- NLP
- Generative AI
- RAG
- Docker
- Kubernetes
- Microservices
- Inference Optimization
Возможные вопросы на собеседовании
Проверка понимания архитектуры RAG и способов борьбы с галлюцинациями.
Как бы вы спроектировали систему оценки (evaluation) для RAG-пайплайна, чтобы минимизировать риск предоставления неверной информации пользователю?
Оценка навыков оптимизации производительности.
Какие методы оптимизации инференса LLM (квантование, спекулятивное декодирование и т.д.) вы применяли на практике и какой выигрыш в latency они давали?
Проверка опыта проектирования агентных систем.
Опишите ваш подход к реализации Tool Calling для агента: как вы обрабатываете ошибки выбора инструмента или невалидные аргументы от модели?
Проверка инженерных навыков в контексте микросервисов.
С какими основными сложностями вы сталкивались при деплое LLM-сервисов в Kubernetes и как решали вопросы масштабирования под нагрузкой?
Проверка знаний в области современных архитектур.
В чем принципиальное различие между подходами ReAct и Plan-and-Solve при проектировании автономных агентов, и в каких кейсах вы бы выбрали каждый из них?
Похожие вакансии
Архитектор мультиагентных систем на базе LLM
Аналитик AI-агентов Senior
AI-разработчик (Senior)
Аналитик AI-агентов
Senior Analyst AI-агентов
Middle/Senior AI-разработчик
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!