- Страна
- США
- Зарплата
- 170 000 $ – 216 000 $
Откликайтесь
на вакансии с ИИ

Software Engineer, Large Model Evaluation
Исключительная вакансия в одной из лидирующих компаний в сфере автономного вождения. Высокая зарплата, работа с передовыми технологиями (LLM, VLM) и социально значимая миссия делают эту позицию крайне привлекательной для топовых инженеров.
Сложность вакансии
Высокая сложность обусловлена необходимостью глубоких знаний в области архитектур трансформеров и LLM/VLM, а также спецификой работы с беспилотными технологиями, где цена ошибки крайне велика. Требуется сильная математическая база для разработки новых метрик оценки в условиях неопределенности.
Анализ зарплаты
Предложенный диапазон $170k–$216k полностью соответствует рыночным стандартам для Senior/Staff уровней в Кремниевой долине. С учетом бонусов и акций (RSU), совокупный доход может значительно превышать медиану рынка.
Сопроводительное письмо
I am writing to express my strong interest in the Software Engineer position within the Large Model Evaluation team at Waymo. With a solid foundation in AI fundamentals and extensive experience in quantitative data analysis, I am eager to contribute to the mission of building the world's most trusted driver. My background in developing robust metrics for complex ML systems aligns perfectly with Waymo's focus on rigorous evaluation of LLMs and VLMs in safety-critical environments.
In my previous work, I have successfully built data pipelines for large-scale simulations and conducted deep-dive analyses to diagnose model regressions. I am particularly drawn to this role because it sits at the intersection of generative AI and real-world robotics, where creative simulation strategies are paramount. I am confident that my proficiency in Python and experience with deep learning frameworks like JAX and PyTorch will allow me to make immediate contributions to your evaluation infrastructure and help accelerate the deployment of the Waymo Driver.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в waymo уже сейчас
Присоединяйтесь к команде Waymo, чтобы определять стандарты безопасности беспилотного транспорта с помощью передовых методов оценки больших нейросетевых моделей.
Описание вакансии
Waymo is an autonomous driving technology company with the mission to be the world's most trusted driver. Since its start as the Google Self-Driving Car Project in 2009, Waymo has focused on building the Waymo Driver—The World's Most Experienced Driver™—to improve access to mobility while saving thousands of lives now lost to traffic crashes. The Waymo Driver powers Waymo’s fully autonomous ride-hail service and can also be applied to a range of vehicle platforms and product use cases. The Waymo Driver has provided over ten million rider-only trips, enabled by its experience autonomously driving over 100 million miles on public roads and tens of billions in simulation across 15+ U.S. states.
The Large Model Evaluation team is at the nexus of Waymo’s AI ambition. With advancements in Large Language Models (LLMs) and Vision-Language Models (VLMs), Waymo is building state-of-the-art AI systems that handle the full complexity of real-world driving. At its core, our progress is defined by our ability to measure it. While robust evaluation is the bottleneck for deploying any large model, the challenge at Waymo is uniquely complex and safety-critical. We are looking for quantitatively-minded engineers to research and propose new ways to assess the ML models deployed in the Waymo Driver.
You will:
- Develop novel metrics and sampling techniques to measure the driving trajectories generated by ML models.
- Employ creative simulation strategies to measure the driving performance of generative AI models. Identify potential edge cases, and provide reliable performance insights that inform model development and deployment.
- Build data pipelines for signal discovery, data labeling, feature extraction and metric computation based on large-scale simulations.
- Conduct data analysis to diagnose regressions in ML models.
- Collaborate with world-class engineering and research teams that develop large-scale ML models.
You have:
- BS/MS/PhD in Computer Science, Machine Learning, Robotics, Statistics, Physics, Math or another quantitative area
- Proficiency in programming in Python or C++
- Knowledge of AI fundamentals, such as transformer architectures, distillation techniques, etc.
- Demonstrated industry or research experience with creative problem solving and rigorous data analysis of open-ended quantitative problems
We prefer:
- Familiarity with one of the modern deep learning frameworks (e.g. JAX, Tensorflow, Pytorch)
- Experience evaluating the quality of ML models
The expected base salary range for this full-time position across US locations is listed below. Actual starting pay will be based on job-related factors, including exact work location, experience, relevant training and education, and skill level. Your recruiter can share more about the specific salary range for the role location or, if the role can be performed remote, the specific salary range for your preferred location, during the hiring process.
Waymo employees are also eligible to participate in Waymo’s discretionary annual bonus program, equity incentive plan, and generous Company benefits program, subject to eligibility requirements.
Salary Range
$170,000—$216,000 USD
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- C++
- Machine Learning
- Large Language Models
- Vision Language Models
- Transformer
- JAX
- TensorFlow
- PyTorch
- Data Analysis
- Simulation
- Robotics
- Statistics
Возможные вопросы на собеседовании
Проверка понимания специфики оценки генеративных моделей в контексте вождения.
Как бы вы подошли к разработке метрики для оценки 'плавности' и 'естественности' траектории, сгенерированной VLM, которая при этом не жертвует безопасностью?
Оценка навыков работы с данными и поиска редких событий.
Опишите ваш подход к поиску и приоритизации 'edge cases' (краевых случаев) в огромном массиве данных симуляций.
Проверка технических знаний архитектур.
В чем заключаются основные сложности оценки моделей на базе архитектуры Transformer при их использовании в задачах реального времени, таких как автономное вождение?
Оценка опыта работы с пайплайнами данных.
Расскажите о самом сложном случае регрессии модели, который вы диагностировали. Какие инструменты и статистические методы вы использовали для выявления первопричины?
Проверка навыков работы с симуляциями.
Как сбалансировать использование синтетических данных из симуляций и реальных данных с дорог при валидации критически важных для безопасности функций?
Похожие вакансии
MLOps Engineer (Python)
AI Engineer (CV & Navigation)
Middle, Middle+, Senior GenAI/LLM Разработчик
Middle / Senior GenAI Engineer (CV)
AI Engineer / AI Mentor
Junior разработчик agent AI-систем
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- США
- Зарплата
- 170 000 $ – 216 000 $