yandex
Страна
США
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorВ офисеПолная занятость

Senior Cloud Engineer – ELERA Platform (AI-Enabled Reliability & Operations)

ИИОценка ИИ

Позиция в стабильной глобальной компании с отличным соцпакетом и работой над современным стеком (AKS, OpenTelemetry, AI). Высокая значимость продукта (ELERA) для мирового ритейла обеспечивает интересные задачи и профессиональный рост.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Роль требует глубоких знаний Kubernetes (AKS) и опыта работы с высоконагруженными распределенными системами (5–8 лет). Особый акцент сделан на практических навыках отладки, мониторинга (OpenTelemetry, Prometheus) и обеспечении отказоустойчивости в гибридных средах.

Анализ зарплаты

Медиана155 000 $
Рынок135 000 $ – 180 000 $
ИИОценка ИИ

Предлагаемая роль Senior Cloud Engineer в районе Research Triangle Park (Дарем, Северная Каролина) соответствует рыночным стандартам для опытных инженеров. Указанный диапазон отражает специфику региона, который является крупным технологическим хабом, но имеет более низкую стоимость жизни по сравнению с Кремниевой долиной.

Сопроводительное письмо

I am writing to express my strong interest in the Senior Cloud Engineer position for the ELERA Platform at Toshiba Global Commerce Solutions. With over 7 years of experience in managing large-scale Kubernetes environments and a deep focus on Azure AKS, I am confident in my ability to enhance the reliability and performance of your retail-focused cloud and edge solutions. My background in implementing resilience patterns and instrumenting services with OpenTelemetry aligns perfectly with your goals for reducing MTTR and optimizing latency for critical payment flows.

Throughout my career, I have specialized in bridging the gap between cloud infrastructure and production operations. I have a proven track record of tuning microservices performance and managing complex distributed systems, which I believe will be instrumental in supporting the ELERA platform's hybrid architecture. I am particularly excited about Toshiba's vision for 'Together Commerce' and the opportunity to apply AI-enabled engineering to automate incident response and improve system observability for your impressive global customer base.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в toshibaglobalcommercesolutions уже сейчас

Присоединяйтесь к мировому лидеру ритейл-решений и внедряйте инновации на стыке облачных технологий и ИИ!

Описание вакансии

Toshiba Global Commerce Solutions is seeking a Senior Cloud Engineer – ELERA Platform (AI-Enabled Reliability & Operations) that is a hands-on engineering role responsible for deploying, operating, and improving ELERA across cloud and hybrid retail environments. This position focuses on reliability, uptime, performance, observability, and incident response for production systems operating at scale.

You will build and operate the systems that keep stores running—working across Kubernetes, observability, performance, and automation—with direct impact on:

  • Uptime
  • Latency (scan + payment flows)
  • MTTR

You are not designing strategy—you are implementing and running production systems at scale, with increasing ownership over reliability and performance.

Responsibilities

Deploy & Operate ELERA in Cloud + Store Environments

  • Build and maintain AKS-based deployments
  • Support hybrid architectures (store edge + cloud)
  • Configure networking, scaling, and failover behaviors
  • Work with customer environments to ensure production readiness

Reliability & Uptime Engineering

  • Implement resilience patterns (health checks, probes, circuit breakers, retries)
  • Monitor system health and respond to incidents
  • Fix root causes and support uptime targets

Observability & Telemetry

  • Instrument services using OpenTelemetry
  • Configure metrics (Prometheus) and build dashboards (Grafana)
  • Track API latency, error rates, and store-level performance
  • Support in-store aggregation patterns to reduce cloud load

Performance Engineering

  • Identify bottlenecks in microservices, messaging systems, and data layers
  • Support performance testing and validation
  • Work with load tools and telemetry to diagnose latency issues
  • Improve throughput and system performance

Incident Response & MTTR Reduction

  • Participate in production incidents
  • Analyze logs, traces, and metrics to identify root cause
  • Contribute to runbooks and automated recovery scripts
  • Reduce detection and resolution time

AI-Enabled Engineering

  • Use AI tools to analyze logs and errors
  • Assist in debugging and RCA
  • Integrate AI with alerting workflows and triage systems
  • Contribute to automation for common failure scenarios

Required Qualifications

  • 5–8 years of hands-on engineering experience
  • Strong experience with Kubernetes (AKS preferred)
  • Background in microservices architectures
  • Experience deploying and supporting distributed production systems
  • Familiarity with observability: metrics, logs, tracing
  • Ability to debug production issues
  • Experience with at least one cloud provider (Azure preferred)
  • Solid understanding of:
  • REST APIs
  • Scaling fundamentals
  • Failure-handling patterns

Preferred Qualifications

  • Exposure to retail systems, POS, or edge environments
  • Experience with OpenTelemetry instrumentation
  • Background in MongoDB performance tuning
  • Prior experience in incident response or on-call rotations
  • Familiarity with performance testing tools such as k6 or JMeter

Toshiba Global Commerce Solutions is a dynamic billion-dollar global company based in Research Triangle Park, NC, providing retail store solutions to your favorite brands. Have you ever been in a hurry and made use of the self-checkout at Lowe's Foods, earned fuel rewards at Kroger, or just paid for purchases at retailers such as Walmart, Michaels, Carrefour, The Gap, Calvin Klein, Boots, Cencosud, BJ's, or Costco? These are just a few examples of our in-store solutions and impressive customer base that made us the world's installed market share leader.

The nature of retail is changing quickly, so if you share our 'Together Commerce' vision of a seamless two-way, participatory shopping experience, let's get together to drive the new economy.

Toshiba Global Commerce Solutions, Inc. offers a competitive salary and generous benefits package including the following:

  • Group health coverage (medical, dental, & vision)
  • Employee Assistance Programs
  • Pre-tax spending accounts
  • 401(k) plan (with company match)
  • Company provided life insurance
  • Pet Insurance
  • Employee discounts
  • Generous paid holiday schedule, paid vacation & sick/personal days

EEO:

Toshiba Global Commerce Solutions is an equal opportunity/affirmative action employer that evaluates qualified applicants without regard to age, ancestry, color, religious creed, disability, marital status, medical condition, genetic information, military or veteran status, national origin, race, sex, gender, gender identity, gender expression and sexual orientation or any other protected factor. We also consider qualified applicants regardless of criminal histories, consistent with legal requirements.

Individuals who need a reasonable accommodation because of a disability for any part of the employment process should email benefits@toshibagcs.com to request an accommodation

DIVERSITY, EQUITY & INCLUSION:

We at Toshiba Global Commerce Solutions firmly believe that our people are an integral part to the success of our customers. Furthermore, we're committed to Diversity, Equity, and Inclusion for all our people as highlighted by our 5 Core Principles (Create Outreach, Foster Belonging, Unleash Opportunity, Diverse Cultural Engagement and Culture of Transparency). We're passionate about our customers the retail industry and becoming a more responsible company as we help create a brighter future.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Azure
  • Kubernetes
  • Prometheus
  • Grafana
  • OpenTelemetry
  • Microservices
  • Incident Response
  • REST API
  • Automation
  • MongoDB
  • k6
  • JMeter
  • Azure Kubernetes Service (AKS)

Возможные вопросы на собеседовании

Проверка опыта работы с гибридными архитектурами, упомянутыми в вакансии (облако + магазин).

Расскажите о вашем опыте развертывания и поддержки приложений в гибридных средах. С какими специфическими проблемами сетевого взаимодействия между edge-устройствами и облаком вы сталкивались?

Вакансия делает упор на надежность и паттерны отказоустойчивости.

Какие паттерны обеспечения отказоустойчивости (Circuit Breaker, Retries) вы внедряли в Kubernetes? Как вы настраивали liveness и readiness пробы для сложных микросервисов?

Одной из ключевых задач является внедрение OpenTelemetry.

Опишите ваш подход к внедрению OpenTelemetry в существующую микросервисную архитектуру. Какие метрики вы считаете критическими для отслеживания задержек в платежных операциях?

Роль подразумевает участие в инцидент-менеджменте.

Опишите самый сложный инцидент в продакшене, который вы расследовали. Какие инструменты (логи, трассировка, метрики) помогли вам найти первопричину (RCA)?

В описании упоминается использование ИИ для анализа логов.

Как вы планируете использовать инструменты ИИ для автоматизации анализа логов и ускорения процесса реагирования на инциденты (MTTR)?

Похожие вакансии

MD
Mad Devs
3 500 $ – 5 000 $

Senior DevOps / Voice Infrastructure Engineer

SeniorУдалённо
Asterisk · FreeSWITCH · Kamailio · OpenSIPS · SIP · RTP · SRTP · WebRTC · GCP · AWS · Kubernetes · Terraform · Docker · GitHub Actions · ArgoCD · Prometheus · Grafana · Victoria Metrics · Kafka · PostgreSQL · ClickHouse
+21 навыков
T
TopSelection
270 000 ₽ – 290 000 ₽

Инженер по гибридной инфраструктуре (импортозамещение + облака)

SeniorУдалённо
Linux · Zabbix · VMware · Ansible · Terraform · Yandex Cloud · vSphere · VK Cloud · KVM · Hyper-V · SberCloud · Cloud.ru · Astra Linux Cloud · Simply NGN · Veeam Backup
+15 навыков
А
Артвелл
190 000 ₽ – 210 000 ₽

Senior DevOps

SeniorУдалённо
DevOps · CI/CD · Helm · Kubernetes · OpenShift · DevSecOps · Monitoring · Logging · OpenID Connect · IAM
+10 навыков
C
Centicore
340 000 ₽ – 360 000 ₽

Ведущий DevOps-инженер

SeniorУдалённо
Ansible · Terraform · Kubernetes · Kafka · Jenkins · CI/CD · GitOps · Python · MongoDB · MinIO · VictoriaMetrics · ELK stack · Highload · LLM
+14 навыков
TS
Top Selection
256 000 ₽ – 280 000 ₽

Data Platform Engineer / Big Data SRE (Linux)

SeniorУдалённо
Linux · RHEL · CentOS · Ubuntu · Arenadata DB · Greenplum · Apache Kafka · ClickHouse · PostgreSQL · SQL · Bash · Python · Ansible · Terraform · Prometheus · Grafana · ELK · OpenSearch · Docker · Kubernetes · Hadoop · Apache Spark · Apache Flink · Apache Airflow
+24 навыков
T
TopSelection
280 000 ₽ – 300 000 ₽

Senior DevOps (ML-инфраструктура / GPU)

SeniorУдалённо
Kubernetes · Docker · Terraform · MLflow · Kubeflow · Airflow · DVC · Triton Inference Server · TorchServe · CUDA · GPU · Bash · Python · Prometheus · Grafana · Zabbix · MLOps
+17 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

США