- Страна
- Россия
Откликайтесь
на вакансии с ИИ

DevOps/SRE Engineer
Отличная вакансия для опытных инженеров: работа с передовым стеком (GenAI, LLM), высокая степень ответственности и отсутствие бюрократии. Дополнительные бонусы в виде уроков английского и гибкого отпуска делают предложение очень привлекательным.
Сложность вакансии
Высокая сложность обусловлена требованием опыта от 5 лет, необходимостью работы в часовом поясе США и глубокими знаниями специфических инструментов для ML-инференса (Triton, vLLM). Также требуется опыт работы с гибридными облаками и bare-metal инфраструктурой.
Анализ зарплаты
Зарплата в вакансии не указана, но для Senior DevOps/SRE ролей в американских стартапах с удаленным форматом (вне РФ) рынок предлагает конкурентные условия. Указанный диапазон отражает медиану для специалистов с опытом 5+ лет в международном найме.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Acclaim уже сейчас
Присоединяйтесь к команде Acclaim и создавайте будущее Voice AI платформ на передовом стеке технологий!
Описание вакансии
#vacancy #вакансия
DevOps/SRE Engineer at Acclaim (formerly Aiphoria) - Voice AI Platform
📍 Remote (excluding RU/BY)
💼 Full-time
🕐 Working hours: US timezone
We are looking to strengthen our team for a DevOps/SRE Engineer!
What you'll do:
Deploy, operate, and scale a microservices platform on Kubernetes across AWS, GCP, and on-prem (Rancher), including Docker images and Helm charts
Operate GPU-based ML inference services (Triton, vLLM) on RunPod, Scaleway, and Nebius
Own incident investigation, deployment debugging, and performance troubleshooting
Build and maintain CI/CD pipelines (GitHub + GitLab) and infrastructure as code (Terraform, Ansible)
Develop observability (Grafana/Prometheus, ELK) and manage access control/compliance (NetBird VPN, SOC 2)
Must-have:
Minimum 5 years of experience in a DevOps and/or Site Reliability Engineering role
Strong hands-on experience with Linux system administration
Extensive experience deploying, operating, and scaling Kubernetes in both cloud and bare-metal environments
Deep expertise and practical experience with at least one major cloud provider (preferably Google Cloud Platform)
Proven experience implementing SRE practices and building observability stacks using Grafana, Prometheus, and Loki
Strong adherence to GitOps, Infrastructure as Code (IaC), and CI/CD principles
Advanced expertise in Terraform, Ansible, and Python
What we offer
The team has built award-winning AI products for tech corporations — devices, voice assistants, products that are actually in the world
Cutting-edge tech stack: Speech Technologies, NLP, Generative AI (LLMs, diffusion models), voice-first agentic architecture with privacy-first and on-premises deployment
High engineering bar and real ownership — the team cares about what actually works in production, not what looks good in a demo, and you'll see the impact of your work directly
Fast career progression — a senior-heavy team and a high volume of real problems means you grow faster than you would anywhere else
Startup pace with enterprise stability — real clients, real revenue, no bureaucracy
Fully remote
21 vacation days + public holidays + 5 sick days
Private English lessons via Preply
🔗 Apply: Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- AWS
- Python
- Linux
- Terraform
- Kubernetes
- Helm
- Prometheus
- Grafana
- CI/CD
- Google Cloud Platform
- Docker
- GitOps
- Ansible
- ELK stack
- Loki
- Triton
- vLLM
- Rancher
Возможные вопросы на собеседовании
Проверка опыта работы с ML-специфичной инфраструктурой, указанной в вакансии.
Расскажите о вашем опыте развертывания и масштабирования GPU-воркеров для ML-моделей. С какими специфическими проблемами вы сталкивались при использовании Triton или vLLM?
Вакансия требует опыта работы с Kubernetes в разных средах.
В чем заключаются основные различия в управлении и обеспечении безопасности Kubernetes в публичном облаке (GCP/AWS) и на bare-metal серверах через Rancher?
Оценка навыков автоматизации и владения инструментами IaC.
Как вы организуете структуру Terraform-модулей для управления мультиоблачной инфраструктурой, чтобы обеспечить переиспользование кода и минимизировать риски?
Проверка SRE-компетенций и умения работать с инцидентами.
Опишите ваш подход к созданию системы алертинга в Grafana/Prometheus. Как вы определяете баланс между информативностью и 'fatigue' от уведомлений?
Проверка соответствия графику работы.
Готовы ли вы к работе по часовому поясу США и как вы обычно организуете взаимодействие с распределенной командой в таких условиях?
Похожие вакансии
Senior DevOps
Devops инженер
Главный эксперт сопровождения / Инженер сопровождения информационных систем
Инженер DevOps
Senior DevOps инженер
Infrastructure Engineer
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!