Страна: США
Зарплата: 204 000 $ – 259 000 $

+500% приглашений

Откликайтесь
на вакансии с ИИ

ГибридПолная занятость

Machine Learning Engineer, Runtime & Optimization

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Исключительная вакансия в одной из ведущих компаний мира в области автономного вождения. Высокая заработная плата, работа с передовыми технологиями (JAX, TPU) и возможность напрямую влиять на безопасность и будущее транспорта.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена требованиями к глубоким знаниям архитектуры ML-систем, компиляторов и низкоуровневой оптимизации (CUDA, Triton), а также необходимостью опыта техлида от 2 лет. Работа в Waymo предполагает решение уникальных задач на стыке софта и железа для беспилотных автомобилей.

Анализ зарплаты

Медиана235 000 $

Рынок190 000 $ – 280 000 $

Предложенный диапазон $204k–$259k полностью соответствует рыночным стандартам для позиций уровня Senior/Staff ML Engineer в Кремниевой долине. С учетом бонусов и акций (RSU), совокупный доход может значительно превышать медиану рынка.

I am writing to express my strong interest in the Machine Learning Engineer, Runtime & Optimization position at Waymo. With over five years of experience in ML systems and a deep focus on performance optimization, I am excited by the challenge of deploying complex models on the limited compute resources of autonomous vehicles. My background in JAX, XLA, and CUDA, combined with a track record of leading technical projects, aligns perfectly with your team's mission to make ML workloads faster and more efficient.

In my previous roles, I have successfully implemented model compression and efficient deep learning techniques that significantly reduced latency in production environments. I am particularly impressed by Waymo's scale—having provided over ten million rider-only trips—and I am eager to contribute to the ML Platform team's efforts in making machine learning more accessible across Perception, Planner, and Research. I look forward to the possibility of bringing my expertise in ML system architecture to help Waymo continue building the world's most experienced driver.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в waymo уже сейчас

Присоединяйтесь к Waymo, чтобы оптимизировать будущее автономного вождения и работать с передовыми ML-стеками!

Описание вакансии

Waymo is an autonomous driving technology company with the mission to be the world's most trusted driver. Since its start as the Google Self-Driving Car Project in 2009, Waymo has focused on building the Waymo Driver—The World's Most Experienced Driver™—to improve access to mobility while saving thousands of lives now lost to traffic crashes. The Waymo Driver powers Waymo’s fully autonomous ride-hail service and can also be applied to a range of vehicle platforms and product use cases. The Waymo Driver has provided over ten million rider-only trips, enabled by its experience autonomously driving over 100 million miles on public roads and tens of billions in simulation across 15+ U.S. states.

The ML Platform team at Waymo provides a set of tools to support and automate the lifecycle of the machine learning workflow, including feature and experiment management, model development, optimization and monitoring. These efforts have resulted in making machine learning more accessible to teams at Waymo, including Perception, Planner, Research and Simulation.

We are looking for engineers with ML software or ML systems expertise to help us improve compute performance on both cloud and car. You'll work across the entire ML stack from the system perspective, from efficient deep learning models, model compression, ML software (e.g. JAX, XLA, Triton, and CUDA), to . You will be pleasantly challenged with deploying Waymo ML models on limited computation resources. In this hybrid role, you will report to the Senior Manager of Runtime and Optimization.

You will:

Lead the collaboration with the world-class Waymo ML scientists in perception, planner, research and simulation. Identify opportunities in both systems and models to make ML workloads faster.
Lead projects from proposals through execution by developing junior engineers.
Analyze and improve ML system workloads on both cloud and self-driving cars .
Apply model optimization, efficient deep learning techniques and ML software improvements to Waymo's ML systems.

You have:

M.S. in CS, EE, Deep Learning or a related field
2+ years of experience as a technical lead, including writing project plans, engaging with customer teams, mentoring, responsible for goals & execution, reporting status.
5+ years of experience developing solutions in ML systems or ML software stack (Pytorch/JAX/TF, runtime libraries, ML compiler).
Deep understanding of ML system architecture, performance analysis and tools.
Strong Python or C++ programming skills

We prefer you have one or more of the following:

PhD in CS, EE, Deep Learning or a related field.
Familiarity with the HW architecture of ML hardware accelerators (e.g., GPU/TPU).
Deep knowledge of model optimization or efficient deep learning techniques for foundation models or LLM.
Experience with GPU HW or TPU HW and related system software.

#LI-Hybrid

The expected base salary range for this full-time position across US locations is listed below. Actual starting pay will be based on job-related factors, including exact work location, experience, relevant training and education, and skill level. Your recruiter can share more about the specific salary range for the role location or, if the role can be performed remote, the specific salary range for your preferred location, during the hiring process.

Waymo employees are also eligible to participate in Waymo’s discretionary annual bonus program, equity incentive plan, and generous Company benefits program, subject to eligibility requirements.

Salary Range

$204,000—$259,000 USD

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
C++
JAX
XLA
Triton
CUDA
PyTorch
TensorFlow
Machine Learning
Deep Learning
Model Compression
GPU
TPU
Performance Analysis

Возможные вопросы на собеседовании

Вакансия требует глубокого понимания ML-компиляторов и библиотек времени выполнения.

Можете ли вы описать свой опыт работы с XLA или Triton для оптимизации производительности моделей? С какими основными трудностями вы сталкивались?

Роль предполагает оптимизацию моделей для работы на ограниченных ресурсах автомобиля.

Какие методы сжатия моделей (квантование, прунинг, дистилляция) вы бы применили для тяжелой модели восприятия, чтобы запустить её в реальном времени на GPU/TPU?

Позиция требует 2+ года опыта в качестве технического лида.

Расскажите о проекте, где вы выступали в роли техлида: как вы планировали этапы, управляли ожиданиями заказчиков и помогали в развитии младших инженеров?

Важен опыт анализа производительности систем.

Как вы подходите к профилированию ML-нагрузок для выявления узких мест между CPU, GPU и пропускной способностью памяти?

Упоминается работа с LLM и Foundation Models.

Какие специфические техники оптимизации вы бы использовали для ускорения инференса больших языковых моделей в контексте систем автономного вождения?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

СШАот 204 000 $

Откликайтесь
на вакансии с ИИ

Machine Learning Engineer, Runtime & Optimization

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в waymo уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Можете ли вы описать свой опыт работы с XLA или Triton для оптимизации производительности моделей? С какими основными трудностями вы сталкивались?

Какие методы сжатия моделей (квантование, прунинг, дистилляция) вы бы применили для тяжелой модели восприятия, чтобы запустить её в реальном времени на GPU/TPU?

Расскажите о проекте, где вы выступали в роли техлида: как вы планировали этапы, управляли ожиданиями заказчиков и помогали в развитии младших инженеров?

Как вы подходите к профилированию ML-нагрузок для выявления узких мест между CPU, GPU и пропускной способностью памяти?

Какие специфические техники оптимизации вы бы использовали для ускорения инференса больших языковых моделей в контексте систем автономного вождения?

Похожие вакансии

T-shape Аналитик AI (Middle / Senior)

Архитектор мультиагентных систем на базе LLM

Fullstack разработчик-подмастерье (AI Engineer)

Fullstack / AI разработчик (подмастерье)

Специалист по AI-инструментам

Python-разработчик в команду запуска внутренних AI-сервисов

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Machine Learning Engineer, Runtime & Optimization

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в waymo уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Можете ли вы описать свой опыт работы с XLA или Triton для оптимизации производительности моделей? С какими основными трудностями вы сталкивались?

Какие методы сжатия моделей (квантование, прунинг, дистилляция) вы бы применили для тяжелой модели восприятия, чтобы запустить её в реальном времени на GPU/TPU?

Расскажите о проекте, где вы выступали в роли техлида: как вы планировали этапы, управляли ожиданиями заказчиков и помогали в развитии младших инженеров?

Как вы подходите к профилированию ML-нагрузок для выявления узких мест между CPU, GPU и пропускной способностью памяти?

Какие специфические техники оптимизации вы бы использовали для ускорения инференса больших языковых моделей в контексте систем автономного вождения?

Похожие вакансии

T-shape Аналитик AI (Middle / Senior)

Архитектор мультиагентных систем на базе LLM

Fullstack разработчик-подмастерье (AI Engineer)

Fullstack / AI разработчик (подмастерье)

Специалист по AI-инструментам

Python-разработчик в команду запуска внутренних AI-сервисов

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ