Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

SeniorГибридПолная занятость

Senior LLM Engineer

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Отличная позиция для Senior-специалиста: работа с современным стеком (GenAI, GPU-кластеры), сильная команда и прямой доступ к реальным бизнес-кейсам крупного банка. Высокий уровень доверия к вакансии и наличие ресурсов (GPU, бюджет) делают её крайне привлекательной.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует глубокой экспертизы не только в ML, но и в инфраструктурных вопросах (K8s, Docker), а также специфического опыта с LLM-агентами и RAG в условиях крупного энтерпрайза. Высокая планка ожиданий по оптимизации стоимости и latency инференса.

Анализ зарплаты

Медиана450 000 ₽

Рынок350 000 ₽ – 600 000 ₽

В вакансии не указана вилка, однако для позиции Senior LLM Engineer в Москве в банковском секторе рыночные предложения обычно начинаются от 400 000 рублей net. Учитывая комментарий о 'высоком доверии' и наличии бюджета, можно ожидать компенсацию на уровне или выше верхней границы рынка.

Меня крайне заинтересовала вакансия Senior LLM Engineer в вашу команду. Мой опыт в ML/DL более двух лет и глубокое понимание архитектур RAG, механизмов tool calling и оптимизации инференса позволяют мне эффективно решать задачи по созданию сложных агентных систем. Я имею практический опыт работы с Docker и Kubernetes, что критично для доведения прототипов до стабильного production-состояния.

Особенно привлекает возможность работы над внутренней AI Platform и эксплуатация open-source моделей на GPU-кластерах. Я уверен, что мои навыки в области оценки качества LLM-систем (evals) и опыт построения микросервисной архитектуры помогут усилить CIB LLM Team. Буду рад обсудить, как мой опыт в GenAI может быть полезен для автоматизации бизнес-процессов вашего банка.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Присоединяйтесь к CIB LLM Team и создавайте AI-платформу будущего для крупнейшего корпоративного бизнеса!

Описание вакансии

tldr: Senior LLM Engineer в крупный банк. Внутренняя AI Platform, open-source LLM, агенты/RAG. Гибрид, Москва.

[вилки нет, но вакансия прошла голосование на высоком доверии к автору, деньги есть]

Мы в команде CIB LLM Team отвечаем за AI Platform для корпоративного бизнеса банка: LLM API Gateway, AI Chat, агентные решения, инфраструктуру для моделей и агентов, инструменты для создания AI-продуктов.

Ищем LLM-инженера, который усилит нашу команду в направлении внутренних AI-продуктов, агентов, RAG и оптимизации инференса.

Что делать:

\* отвечать за внутреннюю AI Platform и инструменты для AI-приложений;

\* проектировать агентов для автоматизации бизнес-процессов;

\* работать с RAG, tool calling и корпоративными знаниями;

\* оптимизировать качество, стоимость и latency инференса;

\* участвовать в выборе и эксплуатации open-source LLM;

\* доводить гипотезы и прототипы до production.

Что важно:

\* уверенный Python;

\* опыт ML/DL от 2 лет;

\* понимание современных LLM/NLP/GenAI;

\* опыт production-систем на базе LLM;

\* понимание retrieval, routing, tool calling, memory, evaluation;

\* опыт с Docker/Kubernetes и микросервисной архитектурой.

Будет плюсом:

\* глубокое понимание эвалов для LLM-систем;

\* опыт в self-hosted инференсе;

\* опыт промышленной разработки.

Мы предлагаем:

\* возможность работать над AI Platform для крупного корпоративного бизнеса;

\* работу над продуктами, которыми ежедневно пользуются сотрудники банка;

\* сильную инженерную команду, автономность и влияние на архитектуру;

\* возможность работать с современными open-source моделями и GPU-кластером;

\* ДМС, обучение, конференции, гибрид и офис в центре Москвы.

Откликнуться: присылайте резюме Камиле — Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
Machine Learning
Deep Learning
LLM
NLP
Generative AI
RAG
Docker
Kubernetes
Microservices
Inference Optimization

Возможные вопросы на собеседовании

Проверка понимания архитектуры RAG и способов борьбы с галлюцинациями.

Как бы вы спроектировали систему оценки (evaluation) для RAG-пайплайна, чтобы минимизировать риск предоставления неверной информации пользователю?

Оценка навыков оптимизации производительности.

Какие методы оптимизации инференса LLM (квантование, спекулятивное декодирование и т.д.) вы применяли на практике и какой выигрыш в latency они давали?

Проверка опыта проектирования агентных систем.

Опишите ваш подход к реализации Tool Calling для агента: как вы обрабатываете ошибки выбора инструмента или невалидные аргументы от модели?

Проверка инженерных навыков в контексте микросервисов.

С какими основными сложностями вы сталкивались при деплое LLM-сервисов в Kubernetes и как решали вопросы масштабирования под нагрузкой?

Проверка знаний в области современных архитектур.

В чем принципиальное различие между подходами ReAct и Plan-and-Solve при проектировании автономных агентов, и в каких кейсах вы бы выбрали каждый из них?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

Senior LLM Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Как бы вы спроектировали систему оценки (evaluation) для RAG-пайплайна, чтобы минимизировать риск предоставления неверной информации пользователю?

Какие методы оптимизации инференса LLM (квантование, спекулятивное декодирование и т.д.) вы применяли на практике и какой выигрыш в latency они давали?

Опишите ваш подход к реализации Tool Calling для агента: как вы обрабатываете ошибки выбора инструмента или невалидные аргументы от модели?

С какими основными сложностями вы сталкивались при деплое LLM-сервисов в Kubernetes и как решали вопросы масштабирования под нагрузкой?

В чем принципиальное различие между подходами ReAct и Plan-and-Solve при проектировании автономных агентов, и в каких кейсах вы бы выбрали каждый из них?

Похожие вакансии

Архитектор мультиагентных систем на базе LLM

Аналитик AI-агентов Senior

AI-разработчик (Senior)

Аналитик AI-агентов

Senior Analyst AI-агентов

Middle/Senior AI-разработчик

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Senior LLM Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Как бы вы спроектировали систему оценки (evaluation) для RAG-пайплайна, чтобы минимизировать риск предоставления неверной информации пользователю?

Какие методы оптимизации инференса LLM (квантование, спекулятивное декодирование и т.д.) вы применяли на практике и какой выигрыш в latency они давали?

Опишите ваш подход к реализации Tool Calling для агента: как вы обрабатываете ошибки выбора инструмента или невалидные аргументы от модели?

С какими основными сложностями вы сталкивались при деплое LLM-сервисов в Kubernetes и как решали вопросы масштабирования под нагрузкой?

В чем принципиальное различие между подходами ReAct и Plan-and-Solve при проектировании автономных агентов, и в каких кейсах вы бы выбрали каждый из них?

Похожие вакансии

Архитектор мультиагентных систем на базе LLM

Аналитик AI-агентов Senior

AI-разработчик (Senior)

Аналитик AI-агентов

Senior Analyst AI-агентов

Middle/Senior AI-разработчик

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ