- Страна
- США
- Зарплата
- 204 000 $ – 259 000 $
Откликайтесь
на вакансии с ИИ

Research Scientist, RL for Autonomous Planning & World Modeling
Это вакансия мечты для исследователя в области AI: работа в лидирующей компании индустрии (Waymo/Alphabet), доступ к уникальным данным и вычислительным ресурсам, а также конкурентная заработная плата и отличный соцпакет.
Сложность вакансии
Роль требует исключительной квалификации: степени PhD, глубоких знаний в области Reinforcement Learning и Foundation Models, а также опыта работы с распределенным обучением (FSDP, Sharding). Высокая планка ожиданий подтверждается требованием публикаций в топовых конференциях (NeurIPS, ICLR).
Анализ зарплаты
Предлагаемая зарплата ($204k - $259k) находится на верхнем уровне рыночных ожиданий для Senior/Staff Research ролей в США. Она полностью соответствует уровню топовых технологических компаний (Big Tech) для специалистов с PhD и специфическим опытом в RL.
Сопроводительное письмо
I am writing to express my strong interest in the Research Scientist position within the AI Foundations team at Waymo. With a solid background in Reinforcement Learning and experience in developing scalable machine learning solutions, I am eager to contribute to Waymo's mission of building the world's most trusted driver. My previous work in post-training and distillation techniques aligns perfectly with your current focus on Foundation World Models and autonomous trajectory planning.
Throughout my career, I have demonstrated a commitment to original research, evidenced by publications in top-tier venues like NeurIPS and ICLR. I am particularly drawn to this role because of Waymo's unique position at the intersection of cutting-edge AI research and real-world robotics applications. I am confident that my proficiency in distributed training frameworks like FSDP and my experience with large-scale inference infrastructure will allow me to make immediate contributions to your internal RL infrastructure and help scale the most promising methods for autonomous driving.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в waymo уже сейчас
Присоединяйтесь к команде Waymo, чтобы создавать будущее автономного вождения с помощью передовых технологий RL и мировых моделей!
Описание вакансии
Waymo is an autonomous driving technology company with the mission to be the world's most trusted driver. Since its start as the Google Self-Driving Car Project in 2009, Waymo has focused on building the Waymo Driver—The World's Most Experienced Driver™—to improve access to mobility while saving thousands of lives now lost to traffic crashes. The Waymo Driver powers Waymo’s fully autonomous ride-hail service and can also be applied to a range of vehicle platforms and product use cases. The Waymo Driver has provided over ten million rider-only trips, enabled by its experience autonomously driving over 100 million miles on public roads and tens of billions in simulation across 15+ U.S. states.
The mission of the Waymo AI Foundations team is to develop machine learning solutions addressing open problems in autonomous driving, towards the goal of safely operating Waymo vehicles in dozens of cities and under all driving conditions. As part of our work, we also initiate and foster collaborations with other research teams in Alphabet. AI Foundations areas that we are currently focusing on include reinforcement learning, learning from demonstration, generative modeling, Bayesian inference, hierarchical learning, and robust evaluation.
In this hybrid role, you will report to a Principal Scientist.
You will:
- Participate in Waymo’s Foundation World Model post-training and evaluation
- Research and develop cutting edge RL and Distillation techniques for Autonomous Vehicle Trajectory Planning
- Integrate emerging research from the broader AI community into Waymo’s internal RL infrastructure, conducting rigorous ablations to identify and scale the most promising methods
- Partner with engineering and research teams across Waymo to share recipes, techniques, and post-training best practices to accelerate our collective know-how
You have:
- PhD or Masters in Computer Science, Machine Learning, Robotics, or a similar technical field; with 3+ years of industry or post-doc research experience in Reinforcement Learning or Foundation Models
- Demonstration of original contributions to the field through high-impact publications (ArXiv, peer-reviewed conferences like NeurIPS/ICLR/CVPR), technical blog posts, or significant open-source contributions
- Proficiency in implementing model training flows in a scalable, distributed and performant manner such as Data parallel, FSDP and other sharding approaches
- A willingness to work with complexity of globally distributed inference infrastructure
We prefer:
- PhD in Computer Science, Machine Learning, or Robotics, with a research focus on Reinforcement Learning, Foundation Models, or Multi-Modal learning
- Extensive experience designing and deploying Reinforcement Learning infrastructure, specifically for on-policy learning or alignment with human preferences
- A consistent history of original contributions to the AI community, evidenced by first-author publications at top-tier venues (e.g., NeurIPS, ICLR, ICRA) or maintaining significant open-source ML projects
- Experience with large scale (many-machine) training infrastructure and techniques for inference with large models such as model sharding/tensor-parallel
((Remote jobs only - Please note that Waymo may not be able to employ remotely in all locations. Please speak with your recruiter about your preferred location for remote work when you begin the interview process.))
The expected base salary range for this full-time position across US locations is listed below. Actual starting pay will be based on job-related factors, including exact work location, experience, relevant training and education, and skill level. Your recruiter can share more about the specific salary range for the role location or, if the role can be performed remote, the specific salary range for your preferred location, during the hiring process.
Waymo employees are also eligible to participate in Waymo’s discretionary annual bonus program, equity incentive plan, and generous Company benefits program, subject to eligibility requirements.
Salary Range
$204,000—$259,000 USD
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Reinforcement Learning
- Machine Learning
- Robotics
- Python
- PyTorch
- Distributed Training
- FSDP
- Generative Modeling
- Bayesian Inference
- Computer Vision
Возможные вопросы на собеседовании
Проверка глубины теоретических знаний в области RL, критически важных для планирования траекторий.
Как бы вы подошли к проблеме баланса между исследованием (exploration) и использованием (exploitation) в контексте обучения с подкреплением для планирования траектории беспилотного автомобиля?
Оценка практического опыта работы с большими моделями и инфраструктурой.
Опишите ваш опыт работы с техниками распределенного обучения, такими как FSDP или тензорный параллелизм. С какими основными узкими местами вы сталкивались при масштабировании?
Связь с текущими задачами команды по World Modeling.
Какую роль, по вашему мнению, играют мировые модели (World Models) в повышении безопасности и эффективности автономного вождения по сравнению с традиционными методами?
Проверка навыков работы с данными и выравнивания моделей.
Как бы вы реализовали процесс дистилляции знаний из крупной Foundation Model в более легкую модель для инференса в реальном времени на борту автомобиля?
Оценка способности работать в междисциплинарной среде.
Расскажите о случае, когда вам приходилось интегрировать результаты последних научных исследований в существующую производственную инфраструктуру. Как вы проводили абляционные исследования?
Похожие вакансии
MLOps Engineer (Python)
AI Engineer (CV & Navigation)
Middle, Middle+, Senior GenAI/LLM Разработчик
Middle / Senior GenAI Engineer (CV)
AI Engineer / AI Mentor
Junior разработчик agent AI-систем
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- США
- Зарплата
- 204 000 $ – 259 000 $