- Страна
- Россия
- Зарплата
- 200 000 ₽ – 400 000 ₽
Откликайтесь
на вакансии с ИИ

DevOps-инженер (AI/LLM Infrastructure)
Интересный технологический стек (AI, LLM, GPU) и достойная оплата для Senior-уровня. Однако работа только через ИП/самозанятость и необходимость очного присутствия в СПб могут подойти не всем.
Сложность вакансии
Высокая сложность обусловлена сочетанием классического DevOps-стека с глубокой экспертизой в области AI/ML (LLM, RAG, векторные БД) и необходимостью настройки физического оборудования.
Анализ зарплаты
Предложенная вилка (200-400к+) полностью соответствует рыночным ожиданиям для Middle+/Senior DevOps инженеров в Санкт-Петербурге, особенно учитывая редкую специализацию в области AI Infrastructure.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Фурштат Поволжье Групп уже сейчас
Присоединяйтесь к амбициозному проекту по созданию суверенной AI-инфраструктуры и работе с мощным GPU-железом в Санкт-Петербурге!
Описание вакансии
Публикатор: Olga Sergeevna
Обсуждение: Откликнуться
#вакансия« DevOps-инженер» для проекта по автоматизации бизнеса и по развертыванию локальных LLM (Ollama, vLLM),
настройке RAG, векторизации и созданию автоматизированных цифровых клонов
Город и адрес офиса: Санкт-Петербург, станция метро "Площадь Восстания"
Формат работы: Гибридный. Офис(желательно, для настройки железа в офисе) и удаленка. Доступ к мощному железу (GPU NVIDIA), поддержка на этапе внедрения.
Занятость: полная, готовность к очной работе в СПб.
Зарплатная вилка: Фиксированная за этапы или проектная.
Full-time.Бюджет: от 300 000 руб. за реализацию базовой инфраструктуры проекта.
Оплата поэтапная за каждый внедренный модуль (IaC, RAG, Data Pipeline, n8n).
\* Уровень Middle+ : 200 000 — 280 000 руб.
\* Уровень Senior/Architect : 300 000 — 400 000+ руб.
Особенности найма: Работа строго с ИП или самозанятыми, обязательное подписание NDA.
Описание вакансии.
Задачи специалиста:
- Infrastructure as Code: Развертывание и настройка серверов (Ubuntu), оркестрация через Docker/Docker Compose.
- AI & RAG: Развертывание локальных моделей (Ollama, vLLM), настройка векторных БД (Qdrant/Milvus), интеграция «тяжелых» моделей для обучения локальных.
- Data Pipeline: Настройка пайплайнов для OCR (распознавание документов), очистки данных и векторизации.
- Integration: Настройка n8n, автоматизация взаимодействия с клиентами через WhatsApp/Telegram (с использованием балансировщиков для обхода блокировок).
- Security: Обеспечение сетевой безопасности, настройка VPN/Proxy для доступа к API при ограничениях.
Требования:
\* Опыт работы DevOps/System Architect от 3 лет.
\* Уверенный стек: Linux, Docker, Python.
\* Практический опыт работы с LLM (развертывание, квантование, RAG).
\* Понимание того, как работают API мессенджеров и методы обхода анти-фрод систем (rate-limiting, имитация активности).
В отклике обязательно прислать:
- Список реализованных проектов (акцент на Docker и AI/LLM).
- Краткое описание стека, который вы предлагаете для решения задач.
- Вашу готовность к очной работе в СПб.
Название компании: Мы — Группа Компаний "Фурштат Поволжье Групп" (сфера: ломбардный бизнес, ювелирный ритейл, недвижимость).Разворачиваем суверенную, полностью изолированную от облаков ИТ-инфраструктуру на собственном
высокопроизводительном оборудовании (GPU NVIDIA).
Контакты:
личные сообщения.
8-9087228974 c 11.00 -23.00
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- Linux
- LLM
- RAG
- OCR
- Docker
- VPN
- n8n
- Milvus
- Ubuntu
- vLLM
- Qdrant
- Proxy
- Docker Compose
- IaC
- NVIDIA GPU
- Ollama
Возможные вопросы на собеседовании
Вакансия предполагает работу с локальными моделями. Важно понимать, как кандидат оптимизирует потребление ресурсов GPU.
Какие методы квантования моделей вы использовали и как это влияло на производительность vLLM/Ollama в ваших проектах?
Проект включает создание RAG-систем. Нужно проверить опыт работы с векторными хранилищами.
Какую векторную БД (Qdrant или Milvus) вы бы выбрали для этого проекта и по каким критериям?
Упоминается обход блокировок и анти-фрод систем. Это специфическая задача для DevOps.
Расскажите о вашем опыте настройки балансировщиков и прокси для работы с API мессенджеров в условиях жестких лимитов.
Работа ведется на собственном железе с GPU. Важно понимание драйверов и контейнеризации для AI.
С какими сложностями вы сталкивались при пробросе GPU NVIDIA в Docker-контейнеры и как решали проблемы с версиями CUDA?
Вакансия требует настройки n8n и пайплайнов данных.
Как вы обеспечиваете отказоустойчивость и мониторинг для self-hosted инстансов n8n при обработке больших потоков данных?
Похожие вакансии
Senior DevOps
Devops инженер
Senior DevOps инженер
Инженер DevOps
DevOps-инженер
DevOps инженер
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!