Страна: Россия
Зарплата: 200 000 ₽ – 400 000 ₽

+500% приглашений

Откликайтесь
на вакансии с ИИ

ГибридПолная занятость

DevOps-инженер (AI/LLM Infrastructure)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Интересный технологический стек (AI, LLM, GPU) и достойная оплата для Senior-уровня. Однако работа только через ИП/самозанятость и необходимость очного присутствия в СПб могут подойти не всем.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена сочетанием классического DevOps-стека с глубокой экспертизой в области AI/ML (LLM, RAG, векторные БД) и необходимостью настройки физического оборудования.

Анализ зарплаты

Медиана300 000 ₽

Рынок220 000 ₽ – 450 000 ₽

Предложенная вилка (200-400к+) полностью соответствует рыночным ожиданиям для Middle+/Senior DevOps инженеров в Санкт-Петербурге, особенно учитывая редкую специализацию в области AI Infrastructure.

Меня крайне заинтересовала вакансия DevOps-инженера в ГК «Фурштат Поволжье Групп», особенно в части развертывания локальных LLM и настройки RAG-систем. Мой опыт работы с Docker, Linux и Python, а также понимание специфики работы с векторными базами данных и оркестрацией моделей через Ollama/vLLM, позволяют мне эффективно решать задачи по созданию изолированной и производительной ИТ-инфраструктуры.

Я имею практический опыт настройки Data Pipeline и автоматизации процессов через n8n, что коррелирует с вашими задачами по интеграции мессенджеров и OCR. Готов к гибридному формату работы в Санкт-Петербурге и работе с высокопроизводительным оборудованием NVIDIA для достижения максимальных результатов проекта. Буду рад обсудить мой стек и реализованные кейсы на интервью.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Фурштат Поволжье Групп уже сейчас

Присоединяйтесь к амбициозному проекту по созданию суверенной AI-инфраструктуры и работе с мощным GPU-железом в Санкт-Петербурге!

Описание вакансии

Публикатор: Olga Sergeevna

Обсуждение: Откликнуться

#вакансия« DevOps-инженер» для проекта по автоматизации бизнеса и по развертыванию локальных LLM (Ollama, vLLM),

настройке RAG, векторизации и созданию автоматизированных цифровых клонов

Город и адрес офиса: Санкт-Петербург, станция метро "Площадь Восстания"

Формат работы: Гибридный. Офис(желательно, для настройки железа в офисе) и удаленка. Доступ к мощному железу (GPU NVIDIA), поддержка на этапе внедрения.

Занятость: полная, готовность к очной работе в СПб.

Зарплатная вилка: Фиксированная за этапы или проектная.

Full-time.Бюджет: от 300 000 руб. за реализацию базовой инфраструктуры проекта.

Оплата поэтапная за каждый внедренный модуль (IaC, RAG, Data Pipeline, n8n).

\* Уровень Middle+ : 200 000 — 280 000 руб.

\* Уровень Senior/Architect : 300 000 — 400 000+ руб.

Особенности найма: Работа строго с ИП или самозанятыми, обязательное подписание NDA.

Описание вакансии.

Задачи специалиста:

Infrastructure as Code: Развертывание и настройка серверов (Ubuntu), оркестрация через Docker/Docker Compose.
AI & RAG: Развертывание локальных моделей (Ollama, vLLM), настройка векторных БД (Qdrant/Milvus), интеграция «тяжелых» моделей для обучения локальных.
Data Pipeline: Настройка пайплайнов для OCR (распознавание документов), очистки данных и векторизации.
Integration: Настройка n8n, автоматизация взаимодействия с клиентами через WhatsApp/Telegram (с использованием балансировщиков для обхода блокировок).
Security: Обеспечение сетевой безопасности, настройка VPN/Proxy для доступа к API при ограничениях.

Требования:

\* Опыт работы DevOps/System Architect от 3 лет.

\* Уверенный стек: Linux, Docker, Python.

\* Практический опыт работы с LLM (развертывание, квантование, RAG).

\* Понимание того, как работают API мессенджеров и методы обхода анти-фрод систем (rate-limiting, имитация активности).

В отклике обязательно прислать:

Список реализованных проектов (акцент на Docker и AI/LLM).
Краткое описание стека, который вы предлагаете для решения задач.
Вашу готовность к очной работе в СПб.

Название компании: Мы — Группа Компаний "Фурштат Поволжье Групп" (сфера: ломбардный бизнес, ювелирный ритейл, недвижимость).Разворачиваем суверенную, полностью изолированную от облаков ИТ-инфраструктуру на собственном

высокопроизводительном оборудовании (GPU NVIDIA).

Контакты:

личные сообщения.

Откликнуться

8-9087228974 c 11.00 -23.00

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
Linux
LLM
RAG
OCR
Docker
VPN
n8n
Milvus
Ubuntu
vLLM
Qdrant
Proxy
Docker Compose
IaC
NVIDIA GPU
Ollama

Возможные вопросы на собеседовании

Вакансия предполагает работу с локальными моделями. Важно понимать, как кандидат оптимизирует потребление ресурсов GPU.

Какие методы квантования моделей вы использовали и как это влияло на производительность vLLM/Ollama в ваших проектах?

Проект включает создание RAG-систем. Нужно проверить опыт работы с векторными хранилищами.

Какую векторную БД (Qdrant или Milvus) вы бы выбрали для этого проекта и по каким критериям?

Упоминается обход блокировок и анти-фрод систем. Это специфическая задача для DevOps.

Расскажите о вашем опыте настройки балансировщиков и прокси для работы с API мессенджеров в условиях жестких лимитов.

Работа ведется на собственном железе с GPU. Важно понимание драйверов и контейнеризации для AI.

С какими сложностями вы сталкивались при пробросе GPU NVIDIA в Docker-контейнеры и как решали проблемы с версиями CUDA?

Вакансия требует настройки n8n и пайплайнов данных.

Как вы обеспечиваете отказоустойчивость и мониторинг для self-hosted инстансов n8n при обработке больших потоков данных?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россияот 200 000 ₽