- Страна
- США
- Зарплата
- 130 000 $ – 170 000 $
Откликайтесь
на вакансии с ИИ

Senior Software Engineer, Observability
Отличная вакансия в быстрорастущей AI-компании с прозрачной вилкой зарплаты, сильным соцпакетом (100% страховка, 401k) и интересными инженерными задачами.
Сложность вакансии
Высокая сложность обусловлена требованиями к глубокому знанию Linux, сетевых протоколов и опыта работы с крупномасштабными флотами серверов. Ожидается умение работать на стыке софта и железа.
Анализ зарплаты
Предложенная вилка $130k-$170k является конкурентоспособной для Senior-позиции в США, особенно с учетом квартальных бонусов и полного покрытия страховки. Она находится в пределах рыночного медианного диапазона для инженеров инфраструктуры.
Сопроводительное письмо
I am writing to express my interest in the Senior Software Engineer, Observability position at Nebius. With over five years of experience in backend development and a strong focus on building scalable infrastructure, I am excited about the opportunity to contribute to a company at the forefront of the AI cloud economy. My background in Python and Go, combined with deep Linux debugging skills, aligns perfectly with your requirements for building robust metrics and maintenance platforms.
In my previous roles, I have successfully designed and operated high-load production systems, focusing on signal quality and system reliability. I am particularly drawn to Nebius's mission of simplifying AI infrastructure and would welcome the chance to collaborate with your hardware and networking teams to enhance fleet-wide visibility. I am confident that my technical expertise and proactive approach to incident resolution will make me a valuable asset to your Hardware Automation department.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в nebius уже сейчас
Присоединяйтесь к Nebius, чтобы строить будущее AI-инфраструктуры и работать с передовыми технологиями мониторинга в глобальном масштабе!
Описание вакансии
Why work at NebiusNebius is leading a new era in cloud computing to serve the global AI economy. We create the tools and resources our customers need to solve real-world challenges and transform industries, without massive infrastructure costs or the need to build large in-house AI/ML teams. Our employees work at the cutting edge of AI cloud infrastructure alongside some of the most experienced and innovative leaders and engineers in the field.
Where we workHeadquartered in Amsterdam and listed on Nasdaq, Nebius has a global footprint with R&D hubs across Europe, North America, and Israel. The team of over 1400 employees includes more than 400 highly skilled engineers with deep expertise across hardware and software engineering, as well as an in-house AI R&D team.
The Role
Nebius is hiring a Senior Software Engineer to design, build, and own backend systems that power metrics, monitor large-scale infrastructure, and develop a comprehensive infrastructure maintenance platform. This role requires strong production experience, sound system design judgment, and the ability to operate and improve critical services.
Your responsibilities will include:
- Design and build services and agents that provide deep visibility into large-scale server fleets and data center engineering systems
- Evolve metrics, aggregation, and alerting pipelines, with a focus on signal quality and reliability
- Design and operate maintenance and remediation systems that enable safe, predictable fleet-wide changes and keep infrastructure healthy
- Investigate production incidents hands-on, including on-host Linux debugging, and drive root-cause fixes
- Collaborate closely with hardware, networking, and data center operations teams to improve reliability
What we expect you to have:
- 5+ years of professional software engineering experience
- Strong production experience with Python and Go, or the ability to ramp up quickly
- Solid Linux fundamentals and comfort debugging live systems
- Ability to write reliable, maintainable code and dig into complex, ambiguous problems
- Experience building and operating production systems at scale
It will be an added bonus if you have:
- Ubuntu experience, including internal tooling and packaging workflows (e.g., building Debian packages)
- CCNA (Cisco Certified Network Associate) or equivalent networking experience
Key employee benefits:
- Health insurance: 100% company-paid medical, dental, and vision coverage for employees and families.
- 401(k) plan: up to 4% company match with immediate vesting.
- Parental leave: 20 weeks paid for primary caregivers, 12 weeks for secondary caregivers.
- Remote work reimbursement: up to $85/month for mobile and internet.
- Disability & life insurance: company-paid short-term, long-term and life insurance coverage.
Compensation
- We offer competitive salaries, ranging from $130k- $170k base + quarterly performance bonuses.
Join Nebius Today!
What we offer
- Competitive salary and comprehensive benefits package.
- Opportunities for professional growth within Nebius.
- Flexible working arrangements.
- A dynamic and collaborative work environment that values initiative and innovation.
We’re growing and expanding our products every day. If you’re up to the challenge and are excited about AI and ML as much as we are, join us!
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- Go
- Linux
- Observability
- System Design
- Ubuntu
- Debian Packaging
- Networking
- CCNA
- Infrastructure Monitoring
Возможные вопросы на собеседовании
Роль требует глубокого понимания Linux для отладки живых систем.
Расскажите о самом сложном инциденте в продакшене, который вы отлаживали на уровне ядра или системных вызовов Linux. Какие инструменты использовали?
Вакансия предполагает работу с метриками и алертами в огромных масштабах.
Как бы вы спроектировали систему агрегации метрик для флота из 100,000 серверов, чтобы минимизировать задержку и избежать потери данных?
Nebius ищет инженера, способного писать на Go и Python.
В каких сценариях при разработке агентов мониторинга вы бы предпочли Go вместо Python, и наоборот? Обоснуйте с точки зрения производительности и потребления ресурсов.
Упоминается работа с сетевыми командами и желателен опыт уровня CCNA.
Опишите процесс прохождения пакета через сетевой стек Linux. Как бы вы диагностировали потерю пакетов между агентом мониторинга и бэкендом?
Позиция Senior подразумевает ответственность за архитектурные решения.
Как обеспечить безопасное проведение автоматизированных изменений (remediation) на всем флоте серверов, чтобы избежать каскадных сбоев?
Похожие вакансии
DevOps Middle +/ Senior
Senior DevOps/Mlops
Devops Middle+ / Senior
Senior DevOps/SRE Engineer (On-Premise инфраструктура)
DevOps - senior
Devops Middle+/Senior
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- США
- Зарплата
- 130 000 $ – 170 000 $