yandex
J
jfrog
Страна
Индия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
ГибридПолная занятость

Site Reliability Engineer

ИИОценка ИИ

JFrog — лидер рынка с отличной репутацией. Вакансия предлагает работу с современным стеком (K8s, Go, AI Ops) и участие в глобальных проектах, хотя гибридный график в Бангалоре может подойти не всем.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Роль требует глубоких знаний Kubernetes и опыта работы с высоконагруженными SaaS-системами. Особую сложность добавляет требование к навыкам разработки на Python/Go и опыт внедрения AI-агентов для автоматизации операций.

Анализ зарплаты

Медиана45 000 $
Рынок35 000 $ – 60 000 $
ИИОценка ИИ

Предлагаемая позиция SRE в международной компании уровня JFrog в Бангалоре обычно оплачивается выше среднего по рынку Индии. Указанный диапазон соответствует уровню Senior/Middle+ специалиста в технологическом хабе Bellandur.

Сопроводительное письмо

I am writing to express my interest in the Site Reliability Engineer position at JFrog. With over four years of experience in managing large-scale production environments and a deep proficiency in Kubernetes across multiple cloud providers, I am confident in my ability to contribute to the reliability and scalability of your SaaS platform. My background in automating operations using Python and Go, combined with a strong focus on SLO/SLI frameworks, aligns perfectly with JFrog's commitment to operational excellence.

I am particularly excited about JFrog's forward-thinking approach to 'Agentic Ops' and the integration of AI into incident response and triage. Having worked extensively with observability stacks like Prometheus and Grafana, and managed complex incident lifecycles via PagerDuty, I am eager to bring my technical expertise to a team that powers software delivery for industry giants like Google and Netflix. I look forward to the possibility of discussing how my skills can support JFrog's mission.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в jfrog уже сейчас

Присоединяйтесь к JFrog в Бангалоре и станьте частью команды, определяющей будущее облачных технологий и SRE-практик!

Описание вакансии

Fast-Frogward Your Career to Years From Now

JFrog is the only end-to-end software supply chain platform that provides complete visibility, security, and control for automating the delivery of trusted releases from code to production. Our platform enables organizations to manage, secure, and automate their software delivery process, fueling innovation without worry. We empower companies to build and release software faster and more securely than ever before.

With over 7,500 customers worldwide, including many Fortune 100 companies, JFrog is at the forefront of global innovation. Join us in shaping the future of software delivery and contributing to solutions that empower some of the world's most influential industries.

Be part of a team where your work takes centre stage, shaping the future of software development. At JFrog, as a Full Stack Engineer, you’ll solve critical challenges for leaders like Amazon, Google, and Netflix. Every day brings opportunities to innovate and push boundaries in a fast-moving, frogward-thinking culture. It’s more than writing code—it’s driving the technology that powers the world. If you want your work to matter and thrive on nonstop innovation, JFrog is your place.

We’re hiring a Site Reliability Engineer to help improve the availability, performance, scalability, and operational excellence of our SaaS environments. You’ll work closely with Engineering and Cloud teams to automate operations, strengthen observability, and improve incident response using modern SRE practices (SLOs/SLIs, error budgets, postmortems). This role is hands-on, collaborative, and impact-focused. If you're eager to make a significant impact in a fast-paced, high-growth environment, we encourage you to apply.

As a Site Reliability Engineer in JFrog you will be responsible for:
  • Improve reliability, scalability, performance, and observability for JFrog SaaS services in partnership with engineering teams.
  • Implement SRE practices: define SLOs/SLIs, run failure analysis, support capacity planning, perform service readiness reviews and drive tech-debt reliability improvements.
  • Support day-to-day operations of our Multi Cloud Global Distributed Cloud Native Kubernetes-based SaaS environments to keep services available, performant, cost efficient and scalable.
  • Build and enhance internal services and tools to streamline operations and reduce toil through automation.
  • Develop and maintain Python/Go automation to improve deployment safety, incident response and operational visibility.
  • Run PoCs, prototype, and drive implementations for agentic automation using an ADK/agent framework, leveraging AI where it meaningfully improves operational & strategic excellence.
  • Support resilience testing/chaos experiments (as appropriate) and improve disaster recovery readiness.
  • Participate in on-call, lead incidents to resolution, and drive postmortems and follow-up actions that prevent recurrence.
  • Act as a primary contact for SaaS production issues, collaborating closely with Product sengineering groups.
  • Evaluate cloud-native technologies and vendor solutions that improve SaaS reliability and lifecycle management.

To be a Site Reliability Engineer in JFrog you need...

  • Experience: 4+ years in SRE, DevOps, or Production Engineering in large-scale production environments.
  • Cloud & Orchestration: Production experience with Kubernetes (Docker) and at least one cloud provider (AWS, GCP, or Azure).
  • SRE Fundamentals: Working knowledge of SLO/SLI, alerting strategy, incident response, postmortems, and reliability improvements.
  • Development: Proficiency in Python or Go for automation, integrations, and internal tools.
  • Observability: Hands-on with metrics/logs/traces using tools like New Relic, Coralogix, Prometheus, Grafana, OpenTelemetry (or equivalents).
  • Incident & Resilience: Strong incident response and triage using PagerDuty/Opsgenie (or equivalent);

Exposure to chaos/resilience testing (e.g., Gremlin) and DR readiness.

  • AI/Agentic Ops: Practical use of AI-assisted operations (e.g., log/incident summarization, triage helpers); familiarity building simple agents with an ADK/agent framework (e.g., LangGraph, LangChain, CrewAI, or similar).
  • CI/CD: Working knowledge of microservices delivery using Jenkins, ArgoCD, or equivalent.
  • Soft Skills: Strong documentation (runbooks, postmortems) and a collaborative, independent problem-solving mindset.

NOTE: We are located in Bangalore (Bellandur) and follow a 3 days from office (mandatory), hybrid work model.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • AWS
  • Azure
  • Python
  • GCP
  • Kubernetes
  • Prometheus
  • Grafana
  • OpenTelemetry
  • Docker
  • Jenkins
  • Go
  • LangChain
  • ArgoCD
  • New Relic
  • PagerDuty

Возможные вопросы на собеседовании

Проверка понимания ключевых метрик SRE и умения их внедрять.

Как бы вы определили SLO и SLI для критически важного микросервиса в составе платформы JFrog?

Оценка навыков автоматизации и борьбы с рутиной (toil).

Расскажите о самом сложном инструменте автоматизации, который вы написали на Python или Go для улучшения надежности системы.

Проверка опыта работы с Kubernetes в реальных условиях.

С какими наиболее сложными проблемами производительности в кластерах Kubernetes вы сталкивались и как их решали?

Оценка готовности к работе с инновационными AI-инструментами в SRE.

Как, по вашему мнению, AI-агенты или LLM могут реально помочь в процессе разбора инцидентов (triage) и уменьшении MTTR?

Проверка навыков управления инцидентами.

Опишите ваш процесс проведения postmortem после серьезного сбоя: как вы обеспечиваете выполнение корректирующих действий?

Похожие вакансии

C
Centicore
340 000 ₽ – 360 000 ₽

Ведущий DevOps-инженер

SeniorУдалённо
Ansible · Terraform · Kubernetes · Kafka · Jenkins · CI/CD · GitOps · Python · MongoDB · MinIO · VictoriaMetrics · ELK stack · Highload · LLM
+14 навыков
MD
Mad Devs
1 500 $ – 2 000 $

Junior DevOps/Systems Engineer

JuniorУдалённо
SSO · SAML · OIDC · SCIM · Python · Bash · TypeScript · Git · Google Workspace · Slack · MDM · MFA
+12 навыков
V
Volna.tech
200 000 ₽ – 240 000 ₽

DevOps Middle/Middle+

MiddleУдалённо
Kubernetes · GitLab CI/CD · Nginx · Docker · Ansible · PostgreSQL · Prometheus · Grafana · ElasticSearch · Gravity
+10 навыков
А
Артвелл
190 000 ₽ – 210 000 ₽

Senior DevOps

SeniorУдалённо
DevOps · CI/CD · Helm · Kubernetes · OpenShift · DevSecOps · Monitoring · Logging · OpenID Connect · IAM
+10 навыков
O
OUTKOD
190 000 ₽ – 220 000 ₽

Devops middle+

MiddleУдалённо
CI/CD · Jenkins · GitLab CI · Ansible · Terraform · Docker · Kubernetes · Prometheus · ELK stack · EFK stack · Graylog
+11 навыков
T
TopSelection
280 000 ₽ – 300 000 ₽

Senior DevOps (ML-инфраструктура / GPU)

SeniorУдалённо
Kubernetes · Docker · Terraform · MLflow · Kubeflow · Airflow · DVC · Triton Inference Server · TorchServe · CUDA · GPU · Bash · Python · Prometheus · Grafana · Zabbix · MLOps
+17 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

J
jfrog
Страна
Индия