- Страна
- Россия
Откликайтесь
на вакансии с ИИ

DevOps-инженер в команду Server Infrastructure
Яндекс — топовый работодатель с сильной инженерной культурой и уникальными по масштабу задачами. Работа в Yandex Cloud дает отличные возможности для профессионального роста, хотя и подразумевает высокую нагрузку.
Сложность вакансии
Высокая сложность обусловлена огромным масштабом инфраструктуры (25к+ серверов) и необходимостью владения как навыками системного администрирования, так и разработки на Python/Go. Требуется опыт работы с SRE-практиками и сложными CI/CD пайплайнами.
Анализ зарплаты
В объявлении не указана зарплата, однако для Senior DevOps инженеров в Москве в крупных тех-компаниях уровень компенсации обычно начинается от 350 000 рублей. Яндекс предлагает конкурентные условия, часто включающие опционную программу.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Яндекс уже сейчас
Присоединяйтесь к команде Server Infrastructure в Яндексе и управляйте облачной инфраструктурой из 25 000 серверов!
Описание вакансии
DevOps-инженер в команду Server Infrastructure
#гибрид
Компания: Яндекс
🔹Какие задачи вас ждут
-Отказоустойчивость и масштабируемость
Вам предстоит отвечать за здоровье и аптайм облачной инфраструктуры. Обеспечивать её отказоустойчивость, масштабируемость и бесперебойную работу, внедрять современные облачные технологии. Улучшать процессы регулярных учений — отключений ДЦ и внедрения контролируемых отказов инфраструктуры и сервисов.
Вы будете проводить оптимизацию производительности и дебаг возникающих проблем. Поддерживать и развивать облачные системы в новых ДЦ и странах (более 25 000 серверов в России). Участвовать в разборах сбоев, искать root cause и внедрять решения, которые предотвратят повторные проблемы.
-Проектирование и автоматизация
Предстоит участвовать в проектировании архитектурных решений для Yandex Cloud и автоматизации инфраструктурных сценариев и процессов. Помогать разработчикам проектировать производительные отказоустойчивые сервисы. Улучшать архитектуру систем управления и автоматизации работы кластера.
-Observability и CI/CD
Нужно будет улучшать наши инструменты диагностики, мониторинга. Разрабатывать новые мониторинги и улучшать имеющиеся. Настраивать графики и алерты, уменьшать количество ложных срабатываний, повышать скорость реакции на критические события. Разрабатывать и совершенствовать процессы деплоя инфраструктурных сервисов и пайплайны CI (Kotlin DSL), переводить существующие механизмы на K8s.
-Разработка и поддержка сервисов
Вы будете разрабатывать и поддерживать сервисы на Python и Go. Создавать инструменты автоматизации управления инфраструктурой и ускоряющие рутинные задачи.
🔹Мы ждем, что вы
-Писали код на Python и/или Go
-Работали с Unix-системами и сетевыми технологиями
-Имели дело с SRE-подходами или DevOps-практиками
-Любите улучшать процессы и автоматизировать задачи: писали сервисы и утилиты для автоматизации
-Умеете не только решать проблемы, но и находить причины их возникновения
-Знаете, как сделать отказоустойчивый масштабируемый сервис
-Способны учиться и готовы делиться опытом
Контакты: Откликнуться
🔥 Подписаться на наши каналы / @best_itjob / @it_rab
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- Kubernetes
- SRE
- CI/CD
- DevOps
- Observability
- Go
- Unix
- Monitoring
- Kotlin DSL
Возможные вопросы на собеседовании
Яндекс уделяет большое внимание надежности. Важно понимать, как кандидат предотвращает каскадные сбои.
Расскажите о вашем опыте внедрения практик Chaos Engineering. Как вы организовывали контролируемые отказы в инфраструктуре?
В вакансии указано использование Kotlin DSL для CI. Вопрос проверяет гибкость в использовании инструментов автоматизации.
Работали ли вы с CI/CD пайплайнами на базе кода (Pipeline as Code)? В чем преимущества использования Kotlin DSL перед YAML-конфигурациями?
Позиция подразумевает разработку сервисов автоматизации.
Опишите самый сложный инструмент автоматизации, который вы написали на Python или Go. Какую проблему он решал?
Работа с облачной инфраструктурой требует глубоких знаний сетей.
Как бы вы организовали мониторинг сетевых задержек между микросервисами в кластере Kubernetes, распределенном по нескольким ДЦ?
Вакансия включает поиск root cause.
Опишите ваш алгоритм действий при разборе инцидента, когда сервис внезапно начал отдавать 5xx ошибки, но метрики CPU и RAM в норме.
Похожие вакансии
Senior DevOps
Devops middle+
DevOps (Middle)
DevOps Engineer
DevOps инженер
DevOps-инженер
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Россия