yandex
Страна
США
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorВ офисеПолная занятость

Senior Cloud Engineer – ELERA Platform (AI-Enabled Reliability & Operations)

Оценка ИИ

Позиция в стабильной глобальной компании с отличным соцпакетом и работой над современным стеком (AKS, OpenTelemetry, AI). Высокая значимость продукта (ELERA) для мирового ритейла обеспечивает интересные задачи и профессиональный рост.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Роль требует глубоких знаний Kubernetes (AKS) и опыта работы с высоконагруженными распределенными системами (5–8 лет). Особый акцент сделан на практических навыках отладки, мониторинга (OpenTelemetry, Prometheus) и обеспечении отказоустойчивости в гибридных средах.

Анализ зарплаты

Медиана155 000 $
Рынок135 000 $ – 180 000 $
Оценка ИИ

Предлагаемая роль Senior Cloud Engineer в районе Research Triangle Park (Дарем, Северная Каролина) соответствует рыночным стандартам для опытных инженеров. Указанный диапазон отражает специфику региона, который является крупным технологическим хабом, но имеет более низкую стоимость жизни по сравнению с Кремниевой долиной.

Сопроводительное письмо

I am writing to express my strong interest in the Senior Cloud Engineer position for the ELERA Platform at Toshiba Global Commerce Solutions. With over 7 years of experience in managing large-scale Kubernetes environments and a deep focus on Azure AKS, I am confident in my ability to enhance the reliability and performance of your retail-focused cloud and edge solutions. My background in implementing resilience patterns and instrumenting services with OpenTelemetry aligns perfectly with your goals for reducing MTTR and optimizing latency for critical payment flows.

Throughout my career, I have specialized in bridging the gap between cloud infrastructure and production operations. I have a proven track record of tuning microservices performance and managing complex distributed systems, which I believe will be instrumental in supporting the ELERA platform's hybrid architecture. I am particularly excited about Toshiba's vision for 'Together Commerce' and the opportunity to apply AI-enabled engineering to automate incident response and improve system observability for your impressive global customer base.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в toshibaglobalcommercesolutions уже сейчас

Присоединяйтесь к мировому лидеру ритейл-решений и внедряйте инновации на стыке облачных технологий и ИИ!

Описание вакансии

Toshiba Global Commerce Solutions is seeking a Senior Cloud Engineer – ELERA Platform (AI-Enabled Reliability & Operations) that is a hands-on engineering role responsible for deploying, operating, and improving ELERA across cloud and hybrid retail environments. This position focuses on reliability, uptime, performance, observability, and incident response for production systems operating at scale.

You will build and operate the systems that keep stores running—working across Kubernetes, observability, performance, and automation—with direct impact on:

  • Uptime
  • Latency (scan + payment flows)
  • MTTR

You are not designing strategy—you are implementing and running production systems at scale, with increasing ownership over reliability and performance.

Responsibilities

Deploy & Operate ELERA in Cloud + Store Environments

  • Build and maintain AKS-based deployments
  • Support hybrid architectures (store edge + cloud)
  • Configure networking, scaling, and failover behaviors
  • Work with customer environments to ensure production readiness

Reliability & Uptime Engineering

  • Implement resilience patterns (health checks, probes, circuit breakers, retries)
  • Monitor system health and respond to incidents
  • Fix root causes and support uptime targets

Observability & Telemetry

  • Instrument services using OpenTelemetry
  • Configure metrics (Prometheus) and build dashboards (Grafana)
  • Track API latency, error rates, and store-level performance
  • Support in-store aggregation patterns to reduce cloud load

Performance Engineering

  • Identify bottlenecks in microservices, messaging systems, and data layers
  • Support performance testing and validation
  • Work with load tools and telemetry to diagnose latency issues
  • Improve throughput and system performance

Incident Response & MTTR Reduction

  • Participate in production incidents
  • Analyze logs, traces, and metrics to identify root cause
  • Contribute to runbooks and automated recovery scripts
  • Reduce detection and resolution time

AI-Enabled Engineering

  • Use AI tools to analyze logs and errors
  • Assist in debugging and RCA
  • Integrate AI with alerting workflows and triage systems
  • Contribute to automation for common failure scenarios

Required Qualifications

  • 5–8 years of hands-on engineering experience
  • Strong experience with Kubernetes (AKS preferred)
  • Background in microservices architectures
  • Experience deploying and supporting distributed production systems
  • Familiarity with observability: metrics, logs, tracing
  • Ability to debug production issues
  • Experience with at least one cloud provider (Azure preferred)
  • Solid understanding of:
  • REST APIs
  • Scaling fundamentals
  • Failure-handling patterns

Preferred Qualifications

  • Exposure to retail systems, POS, or edge environments
  • Experience with OpenTelemetry instrumentation
  • Background in MongoDB performance tuning
  • Prior experience in incident response or on-call rotations
  • Familiarity with performance testing tools such as k6 or JMeter

Toshiba Global Commerce Solutions is a dynamic billion-dollar global company based in Research Triangle Park, NC, providing retail store solutions to your favorite brands. Have you ever been in a hurry and made use of the self-checkout at Lowe's Foods, earned fuel rewards at Kroger, or just paid for purchases at retailers such as Walmart, Michaels, Carrefour, The Gap, Calvin Klein, Boots, Cencosud, BJ's, or Costco? These are just a few examples of our in-store solutions and impressive customer base that made us the world's installed market share leader.

The nature of retail is changing quickly, so if you share our 'Together Commerce' vision of a seamless two-way, participatory shopping experience, let's get together to drive the new economy.

Toshiba Global Commerce Solutions, Inc. offers a competitive salary and generous benefits package including the following:

  • Group health coverage (medical, dental, & vision)
  • Employee Assistance Programs
  • Pre-tax spending accounts
  • 401(k) plan (with company match)
  • Company provided life insurance
  • Pet Insurance
  • Employee discounts
  • Generous paid holiday schedule, paid vacation & sick/personal days

EEO:

Toshiba Global Commerce Solutions is an equal opportunity/affirmative action employer that evaluates qualified applicants without regard to age, ancestry, color, religious creed, disability, marital status, medical condition, genetic information, military or veteran status, national origin, race, sex, gender, gender identity, gender expression and sexual orientation or any other protected factor. We also consider qualified applicants regardless of criminal histories, consistent with legal requirements.

Individuals who need a reasonable accommodation because of a disability for any part of the employment process should email benefits@toshibagcs.com to request an accommodation

DIVERSITY, EQUITY & INCLUSION:

We at Toshiba Global Commerce Solutions firmly believe that our people are an integral part to the success of our customers. Furthermore, we're committed to Diversity, Equity, and Inclusion for all our people as highlighted by our 5 Core Principles (Create Outreach, Foster Belonging, Unleash Opportunity, Diverse Cultural Engagement and Culture of Transparency). We're passionate about our customers the retail industry and becoming a more responsible company as we help create a brighter future.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Azure
  • Kubernetes
  • Prometheus
  • Grafana
  • OpenTelemetry
  • Microservices
  • Incident Response
  • REST API
  • Automation
  • MongoDB
  • k6
  • JMeter
  • Azure Kubernetes Service (AKS)

Возможные вопросы на собеседовании

Проверка опыта работы с гибридными архитектурами, упомянутыми в вакансии (облако + магазин).

Расскажите о вашем опыте развертывания и поддержки приложений в гибридных средах. С какими специфическими проблемами сетевого взаимодействия между edge-устройствами и облаком вы сталкивались?

Вакансия делает упор на надежность и паттерны отказоустойчивости.

Какие паттерны обеспечения отказоустойчивости (Circuit Breaker, Retries) вы внедряли в Kubernetes? Как вы настраивали liveness и readiness пробы для сложных микросервисов?

Одной из ключевых задач является внедрение OpenTelemetry.

Опишите ваш подход к внедрению OpenTelemetry в существующую микросервисную архитектуру. Какие метрики вы считаете критическими для отслеживания задержек в платежных операциях?

Роль подразумевает участие в инцидент-менеджменте.

Опишите самый сложный инцидент в продакшене, который вы расследовали. Какие инструменты (логи, трассировка, метрики) помогли вам найти первопричину (RCA)?

В описании упоминается использование ИИ для анализа логов.

Как вы планируете использовать инструменты ИИ для автоматизации анализа логов и ускорения процесса реагирования на инциденты (MTTR)?

Похожие вакансии

N
NeuroVision
300 000 ₽ – 500 000 ₽

DevOps Engineer / Blockchain & AI Infrastructure Engineer

SeniorУдалённоРоссия
DevOps · Blockchain · Artificial Intelligence · Computer Vision · NVIDIA GPU · CUDA · TensorRT · Kubernetes · Bare Metal · CI/CD
+10 навыков
O
OUTKOD
270 000 ₽ – 320 000 ₽

Devops senior

SeniorУдалённоРоссия
Linux · FreeIPA · Active Directory · TCP/IP · SMTP · IMAP · LDAP · DNS · PKI · Bash · OpenID Connect · Astra Linux
+12 навыков
D
DstLab
240 000 ₽ – 280 000 ₽

Devops Middle+/Senior

SeniorУдалённоРоссия
Kubernetes · Redis · Kafka · Keycloak · PostgreSQL · MonetDB · VK Cloud · GitLab CI · ArgoCD · HashiCorp Vault · Prometheus · Grafana · ELK stack · Linux
+14 навыков
КТ
Комплексные технологии
200 000 ₽ – 220 000 ₽

DevOps Middle +/ Senior

SeniorУдалённоРоссия
SQL · Kubernetes · Docker · Ansible · Prometheus · Grafana · ELK stack · CI/CD · Java · Go · C++ · Bash · Terraform · SonarQube · SAST · Python · Linux · Windows Server · Cisco · MikroTik · Fortinet · Ubiquiti · TCP/IP · DNS · DHCP · BGP · OSPF · VLAN · NAT · Zero Trust · RBAC · SIEM · Zabbix · Wazuh · PowerShell · VMware · Proxmox · Hyper-V · KVM
+39 навыков
WG
WMT Group
300 000 ₽ – 400 000 ₽

Senior DevOps/Mlops

SeniorУдалённоРоссия
Docker · Helm · Jenkins · GitLab CI · Python · Airflow · JupyterHub · MLflow · Seldon Core · CUDA · Kubernetes · Hadoop · Apache Spark · Apache Kafka · ELK stack · LLM · Computer Vision
+17 навыков
HR
Hi, Rockits!
300 000 ₽ – 400 000 ₽

Senior DevOps/SRE Engineer (On-Premise инфраструктура)

SeniorУдалённоРоссия
Kubernetes · Ansible · Terraform · GitLab CI/CD · PostgreSQL · Redis · RabbitMQ · ElasticSearch · Prometheus · Grafana · Linux · Go · Python · Kafka · Vault · NATS · Bash
+17 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Страна
США