Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

LeadУдалённоПолная занятость

Технический лидер SRE

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Cloud.ru — топовый работодатель в РФ с аккредитацией и сложными технологическими задачами. Позиция техлида предлагает высокий уровень влияния на продукт и работу с передовым стеком в сфере AI и Cloud.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль техлида требует не только глубоких технических знаний в SRE и DevOps, но и навыков координации команд, управления инцидентами и внедрения сложных методологий вроде Chaos Engineering. Высокая ответственность за стабильность всей облачной платформы.

Анализ зарплаты

Медиана450 000 ₽

Рынок350 000 ₽ – 600 000 ₽

Зарплата в объявлении не указана, но для позиции Tech Lead SRE в Москве рыночный диапазон значительно выше среднего по IT-сектору. Cloud.ru как крупный игрок обычно предлагает конкурентные условия, соответствующие верхним границам рынка.

Меня заинтересовала вакансия Технического лидера SRE в Cloud.ru, так как мой опыт в обеспечении отказоустойчивости высоконагруженных систем полностью соответствует вашим задачам. Я обладаю глубокой экспертизой в проектировании SLO/SLI, внедрении практик Observability и автоматизации процессов мониторинга, что критично для развития облачной платформы.

На предыдущих проектах я успешно выстраивал процессы Incident Management и проводил глубокий RCA, что позволяло значительно снижать Error Budget. Уверен, что мои навыки в Chaos Engineering и опыт координации DR-тестирований помогут Cloud.ru укрепить позиции лидера в сфере AI и облачных технологий. Буду рад обсудить, как мой опыт поможет вашей команде в достижении целевых показателей надежности.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Cloud.ru уже сейчас

Присоединяйтесь к команде Cloud.ru и станьте ключевым экспертом по надежности облачных систем!

Описание вакансии

**Технический лидер SRE

Cloud․ru — аккредитованная IT-компания в сфере облачных и AI-технологий**

Обязанности

• Проектировать, разрабатывать, внедрять и поддерживать SLO/SLI для всех сервисов;

• Участвовать в устранении инцидентов - в связке со смежными командами устранять сбои и предотвращать их повторение

• Участвовать в заполнении и разборе постмортемов

• Расследовать причины инцидентов (RCA);

• Разрабатывать и выполнять меры, направленные на предотвращение повторных инцидентов;

• Развивать мониторинг и алертинг - разработка, обогащение, настройка метрик, логов, трейсов, алертов, дашбордов, ранбуков (и их регулярный анализ/рефакторинг)

• Автоматизировать рутинную работу

• Ревьюить и помогать дорабатывать DRP, участвовать в качестве координатора в DRT, поддерживать DRP в актуальном состоянии;

• участвовать в разработке и оптимизации процессов, используемых в работе

• Встраивать в процессы практики: observability by default, alerting as code, runbooks, SLO/SLA/SLI

• Помогать командам строить отказоустойчивые сервисы: autoscaling, failover, chaos engineering

• Обеспечивать внутреннюю экспертизу по стабильности, метрикам, инцидентам и error budgets

Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

SRE
SLO
SLI
Observability
Incident Management
RCA
Monitoring
Alerting
DRP
Chaos Engineering
Autoscaling
Failover

Возможные вопросы на собеседовании

Проверка понимания фундаментальных концепций SRE и умения балансировать между скоростью разработки и стабильностью.

Как вы определяете Error Budget для нового сервиса и какие действия предпринимаете, когда он исчерпан?

Оценка опыта в обеспечении наблюдаемости систем и автоматизации алертинга.

Расскажите о вашем опыте реализации подхода Alerting as Code: какие инструменты использовали и как это упростило работу команды?

Проверка навыков кризис-менеджмента и предотвращения повторных сбоев.

Опишите самый сложный инцидент в вашей практике: как проводился RCA и какие меры были приняты для предотвращения рецидива?

Оценка готовности кандидата к проактивному тестированию систем на отказоустойчивость.

Как бы вы организовали процесс Chaos Engineering в крупной облачной компании, чтобы не навредить реальным пользователям?

Проверка лидерских качеств и умения внедрять изменения в процессы других команд.

Как вы убеждаете команды разработки внедрять практики observability by default, если они сосредоточены только на фичах?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

Технический лидер SRE

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Cloud.ru уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Как вы определяете Error Budget для нового сервиса и какие действия предпринимаете, когда он исчерпан?

Расскажите о вашем опыте реализации подхода Alerting as Code: какие инструменты использовали и как это упростило работу команды?

Опишите самый сложный инцидент в вашей практике: как проводился RCA и какие меры были приняты для предотвращения рецидива?

Как бы вы организовали процесс Chaos Engineering в крупной облачной компании, чтобы не навредить реальным пользователям?

Как вы убеждаете команды разработки внедрять практики observability by default, если они сосредоточены только на фичах?

Похожие вакансии

Ведущий DevOps инженер CDEK.Shopping

Руководитель группы DevOps 1С

Tech Lead Infrastructure (K8s, SRE, AI)

Руководитель группы SRE офисных сетей

Email Infrastructure Deliverability Lead

Lead DevOps

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Технический лидер SRE

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Cloud.ru уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Как вы определяете Error Budget для нового сервиса и какие действия предпринимаете, когда он исчерпан?

Расскажите о вашем опыте реализации подхода Alerting as Code: какие инструменты использовали и как это упростило работу команды?

Опишите самый сложный инцидент в вашей практике: как проводился RCA и какие меры были приняты для предотвращения рецидива?

Как бы вы организовали процесс Chaos Engineering в крупной облачной компании, чтобы не навредить реальным пользователям?

Как вы убеждаете команды разработки внедрять практики observability by default, если они сосредоточены только на фичах?

Похожие вакансии

Ведущий DevOps инженер CDEK.Shopping

Руководитель группы DevOps 1С

Tech Lead Infrastructure (K8s, SRE, AI)

Руководитель группы SRE офисных сетей

Email Infrastructure Deliverability Lead

Lead DevOps

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ