yandex
Close
Страна
США
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
УдалённоПолная занятость

Site Reliability Engineer (USA Only - 100% Remote)

Оценка ИИ

Исключительно привлекательная вакансия: прибыльная бутстрап-компания, 100% удаленка, опция работы 4 дня в неделю и сильная инженерная культура. Стек технологий современный, а задачи по масштабированию инфраструктуры действительно масштабные и интересные.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Высокий уровень сложности обусловлен требованиями к глубокой экспертизе в управлении огромными базами данных (терабайты в MongoDB/PostgreSQL) и сложными K8s-кластерами. Роль подразумевает статус финальной точки эскалации для критических систем, что требует исключительной ответственности.

Анализ зарплаты

Медиана200 000 $
Рынок165 000 $ – 250 000 $
Оценка ИИ

Зарплата в объявлении не указана, но для SRE уровня Senior/Staff в США рыночный диапазон составляет $170k-$230k+. Close предлагает конкурентную оплату и бонусы, что соответствует топовым рыночным показателям для удаленных ролей.

Сопроводительное письмо

I am writing to express my strong interest in the Site Reliability Engineer position at Close. With extensive experience in managing large-scale distributed systems and a deep proficiency in AWS, Kubernetes, and Terraform, I am drawn to Close’s commitment to engineering excellence and your "no BS" culture. Having managed multi-terabyte databases and complex CI/CD pipelines in previous roles, I appreciate the stability your team has achieved—four years without scheduled downtime is a remarkable feat that speaks to the quality of your infrastructure.

I am particularly excited about the opportunity to work on projects like automating database lifecycles with Argo Workflows and enhancing multi-region disaster recovery. My background in maintaining high-availability systems and my passion for open-source align perfectly with Close's technical stack and values. I am eager to bring my expertise in SRE practices to help Close continue to scale efficiently while maintaining the resilience and simplicity that your customers rely on.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Close уже сейчас

Присоединяйтесь к Close и стройте надежную инфраструктуру для CRM будущего в полностью удаленном формате!

Описание вакансии

About Us

Close is a bootstrapped, profitable, 100% remote, ~100 person team of thoughtful individuals who prioritize taking ownership and making a meaningful impact. We’re eager to make a product our customers fall in love with over and over again.

We 💛 small scaling businesses. Since 2013, we’ve been building a CRM that focuses on better communication, without the hassle of manual data entry or a complex UI. We are out to supercharge sales productivity with the most modern, thoughtfully designed, all-in-one, communication-focused CRM.

Our backend tech stack consists primarily of Python Flask web apps with our TaskTiger scheduler handling many of the backend asynchronous task processing chores. Our data stores include MongoDB, PostgreSQL, Elasticsearch, and Redis. The underlying infrastructure runs on AWS using a combination of managed services like EKS, MSK, RDS and ElasticCache and non-managed services running on EC2 instances. We have CI/CD pipelines that build Docker images, run automated tests and deploy to Kubernetes clusters. We also use these images in our local development environment allowing coding locally against all of our services. We have a well-documented public API that is consumed by our front-end JavaScript app as well as numerous integrations. Our infrastructure is heavily automated using Terraform, Ansible and other AWS tools.

We love open sourcing our code and ideas on our GitHub and on The Making of Close, our behind-the-scenes Product & Engineering blog. Check out our open source projects like close-mongo-ops-manager, SocketShark, TaskTiger, LimitLion and ciso8601.

About the Role

You will be joining the Infrastructure Team at Close. This team builds and maintains the platform that runs all Close systems (and do we have a lot of those). Work with us and you’ll be working with:

About You

  • You are a rock in the storm. With your hard won expertise, gained through battles won and lost, you consistently build robust systems from quality components fit to underpin mission critical applications. You value simplicity over familiarity. You value resilience over speed. You take pride in building composable and maintainable tools.
  • You’ve worked with a diverse array of infrastructure tools and systems, including:

+ CICD (CircleCI, GitHub Actions, ArgoCD)

+ Configuration Management (Ansible, Terraform)

+ Databases (Elasticsearch, MongoDB, PostgreSQL, ClickHouse)

+ Cloud Computing (Kubernetes, AWS)

+ Telemetry (Loki, Tempo, Grafana, Mimir/Prometheus)

  • You're comfortable working in a fast-paced environment with a small and talented team where you're supported in your efforts to grow professionally. You're able to manage time well, communicate effectively, and collaborate in a fully distributed team.

Come help us with projects like...

  • Fully automating our database’s lifecycles with Argo Workflow
  • Eliminating all static credentials where they may be
  • Reducing downtime and disruption due to maintenance or disaster to new lows
  • Help us improve our multi-region disaster recovery system.

Requirements...

  • Senior 1 & 2 level candidates should have 5+ years of experience building modern infrastructure systems.
  • Staff level candidates should have 8+ years of experience.
  • The buck stops with you! You are the kind of person who is respected as an expert on the systems you run.
  • You have been the final point of escalation in the support of mission critical production systems
  • You are familiar with some of the following technologies: AWS, Terraform, Kubernetes, Ansible, MongoDB, PostgreSQL, Elasticsearch
  • You have a strong grasp of common networking and data transfer protocols such as DNS, HTTP, TCP
  • You are able to speak and write in English
  • You are located in the USA (ET, CT, MT, PT)

Bonus point if you have…

  • Contributed open source code related to our tech stack.
  • Have experience maintaining very large databases
  • Has been through a successful disaster response
  • Have experience with multi-region architectures
  • Have run MLOps systems
  • Experience scaling Temporal

Benefits

  • Competitive compensation including an organization-wide goal-based bonus
  • Paid Time Off: ~5 Weeks PTO upon joining + Winter and Summer Holiday Breaks. Each year with the company, you’ll receive 2 additional PTO days.
  • 80% Work Option: Work with your manager to choose between working 5 day weeks (standard full-time) or 4 day weeks @ 80% pay
  • Paid Parental Leave for primary and secondary caregivers
  • Sabbatical: After 5 years with the team, you’re eligible for a 1 month paid sabbatical
  • Healthcare (US residents): Medical, Dental, Vision with HSA option (US residents), Dependent care FSA (US residents)
  • 401k (US residents): We match 6% contributions with immediate vesting

Our Values

Build a house you want to live in - Examine long-term thinking and action

No BS - Practice transparency and honesty, especially when it’s hard

Invest in each other - Build successful relationships with your coworkers and customers

Discipline equals freedom - Keep your word to yourself and others

Strive for greatness - Constantly challenge yourself and others

Learn More

Listen to our CEO and Founder, Steli Efti, tell the story of Close’s journey in the $0-30m Blueprint.

Watch our culture video from our 2023 team retreat in Milan. Every year our entire team gathers in person to build connection, foster cross-functional collaboration, and have fun. In 2026, we’re headed to Barcelona, Spain!

Explore our product. Check out a demo!

Our Hiring Process

We ask a few role-specific questions as part of our application process. These questions are designed to help us learn more about you from the start so please answer each question thoughtfully. We see this as an opportunity to get to know you beyond your resume.

While we are excited by all the opportunities that generative AI has unlocked, we request that you refrain from relying exclusively on AI tools when completing an application, unless explicitly stated. Every application is read closely by humans and any obviously AI generated applications will be disregarded.

Regardless of fit, you can expect to hear back from our team with an update on the status of your candidacy.

If you progress to the interview process, you’ll receive a full outline of the role-specific interview process in your first touchpoint with us. We do our best to make the hiring process clear and human.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • AWS
  • Python
  • Terraform
  • Kubernetes
  • GitHub Actions
  • Prometheus
  • Grafana
  • PostgreSQL
  • Redis
  • Docker
  • Ansible
  • ElasticSearch
  • MongoDB
  • Flask
  • ArgoCD
  • ClickHouse

Возможные вопросы на собеседовании

Компания гордится отсутствием плановых простоев в течение 4 лет. Важно понять, как кандидат обеспечит доступность при обновлении крупных БД.

Опишите ваш опыт проведения миграций или обслуживания многотерабайтных баз данных (PostgreSQL/MongoDB) без прерывания обслуживания пользователей.

В описании упоминается цель — полное устранение статических учетных данных. Это ключевой вопрос безопасности.

Какие стратегии и инструменты (например, HashiCorp Vault) вы бы использовали для реализации динамических секретов в инфраструктуре AWS/Kubernetes?

Одной из задач является улучшение системы аварийного восстановления в нескольких регионах.

Расскажите о наиболее сложном сценарии аварийного восстановления (Disaster Recovery), с которым вы сталкивались. Что бы вы изменили в архитектуре Close для повышения отказоустойчивости?

Close активно использует ArgoCD и GitHub Actions. Важно проверить навыки автоматизации.

Как бы вы спроектировали пайплайн для автоматизации жизненного цикла базы данных с использованием Argo Workflows, минимизируя риски для данных?

SRE в Close — это 'скала в шторм'. Нужно оценить способность работать под давлением.

Опишите случай, когда вы были последней инстанцией в решении критического инцидента. Как вы координировали действия и какие выводы сделали для предотвращения повторения?

Похожие вакансии

DstLab
240 000 ₽ – 280 000 ₽

Devops Middle+/Senior

SeniorУдалённоРоссия
Kubernetes · Redis · Kafka · Keycloak · PostgreSQL · MonetDB · VK Cloud · GitLab CI · ArgoCD · HashiCorp Vault · Prometheus · Grafana · ELK stack · Linux
+14 навыков
Комплексные технологии
200 000 ₽ – 220 000 ₽

DevOps Middle +/ Senior

SeniorУдалённоРоссия
SQL · Kubernetes · Docker · Ansible · Prometheus · Grafana · ELK stack · CI/CD · Java · Go · C++ · Bash · Terraform · SonarQube · SAST · Python · Linux · Windows Server · Cisco · MikroTik · Fortinet · Ubiquiti · TCP/IP · DNS · DHCP · BGP · OSPF · VLAN · NAT · Zero Trust · RBAC · SIEM · Zabbix · Wazuh · PowerShell · VMware · Proxmox · Hyper-V · KVM
+39 навыков
WMT Group
300 000 ₽ – 400 000 ₽

Senior DevOps/Mlops

SeniorУдалённоРоссия
Docker · Helm · Jenkins · GitLab CI · Python · Airflow · JupyterHub · MLflow · Seldon Core · CUDA · Kubernetes · Hadoop · Apache Spark · Apache Kafka · ELK stack · LLM · Computer Vision
+17 навыков
Avant IT
120 000 ₽ – 200 000 ₽

Middle DevOps Engineer

MiddleУдалённоРоссия
Ansible · Terraform · Python · C++ · Kubernetes · OpenShift · Helm · OpenVPN · Cloudflare · PostgreSQL · Git · SQL · Grafana · GitLab CI · Nexus · Istio · Prometheus · Sentry · Kubespray
+19 навыков
Hi, Rockits!
300 000 ₽ – 400 000 ₽

Senior DevOps/SRE Engineer (On-Premise инфраструктура)

SeniorУдалённоРоссия
Kubernetes · Ansible · Terraform · GitLab CI/CD · PostgreSQL · Redis · RabbitMQ · ElasticSearch · Prometheus · Grafana · Linux · Go · Python · Kafka · Vault · NATS · Bash
+17 навыков
Volna.tech
268 000 ₽ – 294 000 ₽

DevOps - senior

SeniorУдалённоРоссия
Linux · RHEL · Debian · TCP/IP · Docker · Git · GitLab CI · GitHub Actions · TeamCity · Jenkins · Nexus · Artifactory · Terraform · Ansible · Chef · Puppet · OpenStack · AWS · Molecule · TestInfra · REST API
+21 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Close
Страна
США