- Страна
- Канада
Откликайтесь
на вакансии с ИИ

Site Reliability Developer
MaintainX — это быстрорастущий «единорог» с отличным финансированием и реальным продуктом. Вакансия предлагает конкурентную зарплату, опционы и культуру меритократии, что делает её крайне привлекательной для опытных инженеров.
Сложность вакансии
Роль требует не только глубоких технических знаний в области облачных платформ и IaC, но и развитых навыков менторства и коммуникации для внедрения практик SRE в продуктовые команды. Высокая планка ответственности обусловлена масштабом компании и недавним раундом инвестиций.
Анализ зарплаты
Зарплата в объявлении не указана, но для SRE-инженеров уровня Middle/Senior в Канаде (Монреаль/Торонто) рыночные показатели остаются высокими. Учитывая статус компании-единорога и недавнее финансирование, можно ожидать предложения по верхней границе рынка плюс значительный пакет акций.
Сопроводительное письмо
I am writing to express my interest in the Site Reliability Developer position at MaintainX. With over five years of experience in software and production engineering, I have developed a deep appreciation for the balance between rapid feature delivery and system stability. My background in implementing observability standards and mentoring development teams aligns perfectly with your mission to empower engineers and enhance service maturity across the organization.
In my previous roles, I have successfully bridged the gap between platform and product teams by developing shared tooling and establishing clear SLOs that drive data-informed decision-making. I am particularly drawn to MaintainX's 'Smart Humble Optimist' values and your commitment to building a mobile-first solution for the physical world. I am eager to bring my expertise in cloud-native infrastructure and TypeScript to help MaintainX scale its platform while maintaining the high reliability your 12,000+ business customers depend on.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в maintainx уже сейчас
Присоединяйтесь к MaintainX, чтобы строить надежные системы для мировых лидеров индустрии и развивать культуру SRE в быстрорастущем единороге!
Описание вакансии
MaintainX is the world's leading Asset and Work Intelligence platform for industrial and frontline environments. We are a modern, IoT-enabled, cloud-based tool for reliability, safety, and operations of physical equipment and facilities. MaintainX powers operational excellence for 12,000 businesses, including Duracell, Univar Solutions Inc., Titan America, McDonald's, Brenntag, Cintas, Xylem, and Shell.
We recently completed a $150 million Series D funding round, bringing our total funding to $254 million and valuing the company at $2.5 billion.
We’re looking for a Site Reliability Engineer (SRE) to help advance MaintainX’s reliability, observability, and developer autonomy as we scale our platform.
In this role, you’ll partner closely with product and platform engineering teams to improve the stability, resilience, and operational readiness of our services. You’ll work alongside teams to design for reliability from the start, establish clear ownership and standards, and build shared tooling that enables teams to operate their services with confidence.
You’ll also contribute to company-wide initiatives that define how MaintainX approaches reliability engineering, including observability standards, incident response practices, and service health metrics, helping the organization adopt proven industry practices at scale.
This role is well-suited for an engineer who enjoys working across teams, influencing technical direction through strong engineering practices, and turning reliability principles into practical, scalable systems.
What You'll Do:
- Assess service maturity and provide insights to development teams
- Partner with development teams to implement observability best practices
- Enable development teams to become autonomous with their service deployment, support, and infrastructure
- Mentor developers on reliability practices, focusing on making them self-sufficient
- Act as the bridge, ear and eyes of the Platform Division teams to drive tooling and practice adoption across development teams
About You:
- Deep understanding of observability practices in a distributed system environment and how it influences system design and team behaviour
- Practical experience with SRE concepts (SLOs, error budgets, incident management)
- 3–5+ years in software engineering, SRE, DevOps, or production engineering roles with experience operating production systems
- Proficient in cloud-native platforms and infrastructure-as-code concepts and tools
- Working knowledge of at least one programming language (TypeScript/Node.js is a plus)
- Excellent communication and collaboration abilities across technical and non-technical teams
- Ability to translate complex reliability concepts into actionable guidance
- You enjoy enabling teams to succeed independently and measuring success by reduced dependency on you
What’s in it For You:
- Competitive salary and meaningful equity opportunities.
- Healthcare, dental, and vision coverage.
- 401(k) / RRSP enrollment program.
- Take what you need PTO.
- A Work Culture where:
+ You’ll work alongside folks across the globe that reflect the MaintainX values, Smart Humble Optimist.
+ We believe in meritocracy, where ideas and effort are publicly celebrated.
About Us:
Our mission is to deliver one platform for maintenance, repair & operations teams to keep the physical world running. We believe the greatest asset in any organization is the people. That’s why we built an intuitive, mobile-first solution to help boost productivity and collaboration across teams and locations.
MaintainX is committed to creating a diverse environment. All qualified applicants will receive consideration for employment without regard to race, colour, religion, gender, gender identity or expression, sexual orientation, national origin, genetics, disability, age, or veteran status.
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- SRE
- Observability
- SLO
- Incident Management
- TypeScript
- Node.js
- Infrastructure as Code
- Cloud Native
- DevOps
Возможные вопросы на собеседовании
Проверка понимания ключевых концепций SRE и умения применять их на практике.
Как бы вы подошли к определению SLO и Error Budgets для нового микросервиса в экосистеме MaintainX?
Оценка опыта работы с распределенными системами и инструментами мониторинга.
Опишите ваш опыт внедрения практик observability (трассировка, логирование, метрики) в распределенной среде. Какие инструменты вы предпочитаете?
Вакансия делает упор на автономию команд и менторство.
Расскажите о случае, когда вам нужно было убедить команду разработчиков внедрить новую практику надежности. Как вы преодолевали сопротивление?
Проверка навыков реагирования на критические ситуации.
Как вы организуете процесс Incident Response, чтобы минимизировать MTTR и извлечь максимум пользы из постмортемов?
Оценка технических навыков в контексте стека компании.
Какие паттерны проектирования вы используете при написании инфраструктурного кода (IaC) для обеспечения его масштабируемости и тестируемости?
Похожие вакансии
Site Administrator
Principal DevSecOps Engineer
Développeur(se) en fiabilité de site
Staff Site Reliability Engineer, Database
Azure Core Operations - Associate Manager
Cloud Engineer (AWS)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Канада