- Страна
- ОАЭ
- Зарплата
- 6 000 $ – 8 000 $
Откликайтесь
на вакансии с ИИ

Site Reliability Engineer
Привлекательное предложение с высокой зарплатой в долларах и помощью в релокации в Абу-Даби. Работа с передовыми AI-технологиями и сложной инфраструктурой интересна для профессионального роста, хотя требование обязательного переезда может подойти не всем.
Сложность вакансии
Высокая сложность обусловлена требованием глубокой экспертизы в bare metal и сетях (L2/L3) без использования облаков, а также необходимостью релокации в ОАЭ. Позиция подразумевает высокую ответственность за инциденты и работу с air-gapped системами.
Анализ зарплаты
Предлагаемая зарплата в $8,000 (onsite) находится на верхнем уровне рыночных ожиданий для Senior SRE в регионе ОАЭ. Удаленная ставка в $6,000 также конкурентоспособна для международного рынка, учитывая отсутствие налогов в ОАЭ при релокации.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Aleria LLC уже сейчас
Присоединяйтесь к Aleria в Абу-Даби и стройте надежную AI-инфраструктуру на bare metal!
Описание вакансии
Ищу SRE себе в команду.
Формат: удаленно(2 месяца испытательного) обязателен релок после 2 месяцев в Абу Даби
Занятость: full-time
Локация: Абу Даби
Вилка: 6.000$ remote, 8.000$ onsite
Компания: Aleria LLC
Контакт: Откликнуться
Site Reliability Engineer
Aleria — компания из Абу-Даби, разрабатывающая AI-продукты для клиентов в ОАЭ и по всему миру. Небольшая команда, быстрый рост. Работаем на bare metal, без облака. Нужен инженер, который понимает каждый слой — от NIC до Kubernetes pod — и отвечает за то, чтобы всё это работало стабильно под нагрузкой и не падало посреди ночи.
Чем предстоит заниматься:
Обеспечивать надёжность и доступность сервисов на bare metal с Kubernetes поверх железа
Строить и поддерживать observability (Prometheus, Grafana, Loki): метрики, дашборды, алерты, SLO/SLI
Реагировать на инциденты, проводить post-mortem и устранять причины, а не симптомы
Тюнить PostgreSQL и другие БД под продакшен-нагрузку, искать боттлнеки
Поддерживать CI/CD (GHES, ArgoCD), снижать время и риск деплоев
Сетевая инфраструктура: маршрутизация, сегментация, балансировка нагрузки, безопасность
On-premise и air-gapped поставки (~10%)
Capacity planning и работа над снижением toil
Безопасность, которая не тормозит команду
Взаимодействие с командой разработки и инженерами клиентов
Требования:
Глубокий опыт bare metal — без облачных абстракций
Понимание внутреннего устройства Kubernetes, а не только манифестов
Опыт устранения продакшен-инцидентов под давлением, умение быстро находить root cause
Тюнинг БД под нагрузкой (приоритет — PostgreSQL)
Опыт построения observability и систем алертинга с нуля
Опыт on-prem и air-gapped развёртываний
Сети: L2/L3, routing, firewall, VPN
Продакшен Linux troubleshooting
Подход security-mindset с балансом на скорость доставки
Высокая автономность при работе с незнакомым стеком
Видение инфраструктуры за пределами текущей задачи
Английский B2+
Будет плюсом:
Опыт с GPU-кластерами для AI
Ceph/ZFS/распределённые хранилища
Опыт hardening/compliance для гос. заказчиков
Air-gap CI/CD
Не ищем:
YAML-инженеров, которые только применяют готовые манифесты. Нужен человек, который понимает, что происходит под капотом — и готов первым встать ночью, если что-то упало.
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Kubernetes
- Prometheus
- Grafana
- Loki
- PostgreSQL
- CI/CD
- ArgoCD
- Linux
- Bare Metal
- Networking
- L2/L3
- Routing
- VPN
- Ceph
- ZFS
- GPU
Возможные вопросы на собеседовании
Проверка понимания работы K8s на низком уровне без облачных провайдеров.
Расскажите о вашем опыте развертывания и траблшутинга Kubernetes на bare metal: с какими сетевыми плагинами (CNI) работали и как решали проблемы с балансировкой трафика (MetalLB и др.)?
Вакансия требует навыков тюнинга БД под нагрузкой.
Какие параметры PostgreSQL вы бы изменили в первую очередь при возникновении проблем с производительностью записи на высоконагруженном bare metal сервере?
Проверка навыков работы в изолированных средах.
С какими основными сложностями вы сталкивались при организации CI/CD и обновлении компонентов в air-gapped окружениях?
Оценка умения работать с инцидентами.
Опишите самый сложный инцидент в вашей практике: как вы искали root cause и какие меры предприняли, чтобы ситуация не повторилась?
Проверка знаний в области хранения данных.
Был ли у вас опыт работы с распределенными хранилищами (Ceph/ZFS)? Как вы обеспечиваете консистентность и производительность данных в таких системах?
Похожие вакансии
DevOps Middle
DevOps Engineer (Senior)
DevOps Middle/Middle+
Инженер-программист DevOps [Senior]
DevOps (senior)
DevOps Senior
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!