- Страна
- Великобритания
Откликайтесь
на вакансии с ИИ

Senior Site Reliability Engineer (SRE)
Позиция в престижном количественном хедж-фонде с сильной инженерной культурой и современным стеком (Go, K8s, OpenTelemetry). Работа в Лондоне в финансовом секторе обычно предполагает высокие бонусы и отличные возможности для профессионального роста.
Сложность вакансии
Роль требует глубоких знаний Linux, Kubernetes и опыта разработки на Go/Python, а также умения работать с финансовыми системами, где критически важна низкая задержка и высокая надежность. Высокая планка ожидается в области Observability (PromQL, Grafana, OpenTelemetry).
Анализ зарплаты
Зарплата в вакансии не указана, но для позиции Senior SRE в финансовом секторе Лондона (Hedge Funds/Prop Trading) рыночные показатели значительно выше средних по IT-рынку Великобритании. Основную часть дохода часто составляет годовой бонус.
Сопроводительное письмо
I am writing to express my strong interest in the Senior Site Reliability Engineer position at Qube Research & Technologies. With extensive experience in managing containerized workloads and a deep understanding of observability platforms, I am confident in my ability to enhance the reliability and scalability of your engineering platform. My background in developing automation tools with Go and managing infrastructure via Terraform aligns perfectly with QRT's technology-driven approach to systematic investment.
In my previous roles, I have successfully implemented SLIs/SLOs and optimized incident response workflows, significantly reducing operational toil. I am particularly drawn to QRT's collaborative culture and the challenge of maintaining high-quality signals in a rapidly growing environment. I look forward to the opportunity to contribute to your Platform team and help deliver measurable reliability improvements across your global services.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в quberesearchandtechnologies уже сейчас
Присоединяйтесь к QRT, чтобы внедрять передовые SRE-практики в глобальной инвестиционной компании и масштабировать высоконагруженные платформы.
Описание вакансии
Qube Research & Technologies (QRT) is a global quantitative and systematic investment manager, operating in all liquid asset classes across the world. We are a technology- and data-driven group implementing a scientific approach to investing. Combining data, research, technology, and trading expertise has shaped our collaborative mindset, which enables us to solve the most complex challenges. QRT’s culture of innovation continuously drives our ambition to deliver high-quality returns for our investors.
You will join the Platform team focused on improving reliability and day-to-day operability for an actively used and growing engineering platform. The team works closely with software engineers and platform owners to improve observability, incident response, and reliability outcomes, while keeping long-term service ownership with the teams that build and run the services.
Your Future Role within QRT
You will:
- Own the effectiveness of the observability platform, ensuring high-quality signals, alert fidelity, and ongoing suitability as the platform scales
- Build and maintain actionable, low-noise dashboards and alerting across metrics and logs
- Improve incident detection, response, and follow-up, ensuring corrective actions are implemented in systems, configuration, or automation
- Define and apply SLIs and SLOs where they support operational decision-making
- Improve reliability, scalability, and operability of core services through hands-on engineering changes
- Identify recurring failure patterns and reduce manual operational work through automation and improved defaults
- Apply Infrastructure as Code across observability and supporting systems
- Develop tooling and automation in Go (preferred) or Python
- Introduce shared patterns, defaults, and documentation that reduce repeated bespoke work
- Partner with service-owning teams to deliver measurable reliability improvements without transferring long-term service ownership to SRE
Your Present Skillset
- Strong practical experience applying Site Reliability Engineering principles in production environments
- Strong Linux systems knowledge
- Experience building and operating containerised workloads (Docker or Podman)
- Strong development experience in Go (preferred) or Python
- Strong experience querying and reasoning about metrics using PromQL
- Hands-on experience with Grafana, including dashboarding and alerting
- Experience deploying and operating centralised logging systems
- Strong Infrastructure as Code experience
- OpenTelemetry experience (metrics, logs, traces)
- Terraform and/or Ansible experience, plus familiarity with CI/CD pipelines
- Kubernetes and cloud-native platform experience
- Exposure to datacentre services and compute/hardware-backed platforms
- AWS infrastructure configuration and deployment experience
- Evidence of reducing operational load and recurring incidents in growing systems
QRT is an equal opportunity employer. We welcome diversity as essential to our success. QRT empowers employees to work openly and respectfully to achieve collective success. In addition to professional achievement, we are offering initiatives and programs to enable employees achieve a healthy work-life balance.
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- AWS
- Python
- Linux
- Terraform
- Kubernetes
- Grafana
- OpenTelemetry
- CI/CD
- Docker
- Go
- Ansible
- Podman
- PromQL
Возможные вопросы на собеседовании
Проверка практического опыта работы с метриками и способности минимизировать шум в алертах.
Расскажите о вашем опыте внедрения SLI/SLO: как вы выбирали метрики и как это помогло сократить количество ложных срабатываний?
Оценка навыков автоматизации и владения основным стеком компании.
Опишите сложный инструмент или сервис, который вы разработали на Go для автоматизации операционных задач. Какую проблему он решил?
Проверка понимания архитектуры современных систем мониторинга.
Как бы вы спроектировали систему сбора и анализа трейсов с использованием OpenTelemetry для распределенной микросервисной архитектуры?
Оценка навыков траблшутинга в критических ситуациях.
Опишите ваш самый сложный инцидент в продакшене: как вы его обнаружили, локализовали и какие системные изменения внесли, чтобы он не повторился?
Проверка умения работать с инфраструктурой как кодом в масштабе.
С какими трудностями вы сталкивались при управлении инфраструктурой AWS через Terraform в большой команде и как вы их решали?
Похожие вакансии
DevOps Middle +/ Senior
Senior DevOps/Mlops
Devops Middle+ / Senior
Senior DevOps/SRE Engineer (On-Premise инфраструктура)
DevOps - senior
Devops Middle+/Senior
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Великобритания