- Страна
- США
- Зарплата
- 147 000 $ – 211 000 $
Откликайтесь
на вакансии с ИИ

Research Scientist, Response Quality/Hermes
Это вакансия в одной из самых престижных ИИ-лабораторий мира с конкурентной зарплатой, бонусами и возможностью влиять на продукты, которыми пользуются миллионы. Идеальное сочетание фундаментальной науки и продуктового влияния.
Сложность вакансии
Высокая сложность обусловлена требованием степени PhD и глубокой экспертизы в области RL и SFT для LLM. Работа в DeepMind предполагает конкуренцию с ведущими мировыми исследователями и решение фундаментальных задач ИИ.
Анализ зарплаты
Предложенная вилка в $147k–$211k является базовой и соответствует рыночным стандартам для Research Scientist в Кремниевой долине. Однако с учетом бонусов и акций (equity), которые являются стандартной частью компенсации в DeepMind, совокупный доход будет значительно выше медианы рынка.
Сопроводительное письмо
I am writing to express my strong interest in the Research Scientist position within the Response Quality/Hermes team at Google DeepMind. With a PhD focused on large language models and a proven track record of research in post-training methodologies, I have closely followed the evolution of Gemini. My background in Reinforcement Learning and Supervised Fine-Tuning aligns perfectly with your mission to enhance the helpfulness and factuality of information-seeking responses.
In my previous research, I have developed novel evaluation frameworks and optimization techniques that directly address the challenges of model grounding and hallucination. I am particularly excited about the opportunity to work on post-training innovations that impact global products like AI Studio and Vertex AI. My strong software engineering skills ensure that I can not only conceptualize advanced research ideas but also implement them efficiently within Google's large-scale infrastructure.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в deepmind уже сейчас
Присоединяйтесь к команде Google DeepMind и определяйте будущее Gemini в задачах поиска и обработки информации!
Описание вакансии
Research Scientist, Response Quality/Hermes
Mountain View, CA
Snapshot
We are looking for a research scientist who will drive research in Gemini for information tasks. The candidate will primarily work on post-training, but could potentially also work on model-external interventions.
About Us
Our team works on improving Gemini on tasks where users interact with the model to complete information journeys; this includes improving helpfulness and factuality of Gemini models. To this end, we have developed novel post-training innovations to improve the quality, groundedness and factuality of Gemini models in search on mode. Our work impacts product surfaces including AI Mode, Gemini App, AI Studio and Vertex AI.
The Role
In this role, we expect the candidate to work on improving Gemini for information tasks, focusing on quality of information-seeking responses (helpfulness, factuality, grounding, and other aspects). It is an opportunity to explore fundamental issues in modeling and data interventions for information-seeking scenarios, with very significant opportunities in shaping Google’s products in this space.
Key responsibilities:
- Research on post-training (e.g., RL and SFT) for information-seeking scenarios in Gemini
- Research on novel evaluation methods for improving model quality, grounding and factuality
- Research on orchestration of tool calls, and improved retrieval methods, for information-seeking scenarios
About You
In order to set you up for success as a at Google DeepMind, we look for the following skills and experience:
- PhD in a relevant area, or an equivalent research/publication record
- Number of years experience: anything from recent PhD onwards
- Strong software-engineering skills in addition to a research background
In addition, the following would be an advantage: (require maximum of 5 and minimum of 3 items)
- Experience in reinforcement learning
- Experience in post-training methods
- Experience in LLMs for information-seeking scenarios
The US base salary range for this full-time position is between $147,000 USD - 211,000 + bonus + equity + benefits. Your recruiter can share more about the specific salary range for your targeted location during the hiring process.
Note: In the event your application is successful and an offer of employment is made to you, any offer of employment will be conditional on the results of a background check, performed by a third party acting on our behalf. For more information on how we handle your data, please see ourApplicant and Candidate Privacy Policy.
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- Large Language Models
- Information Retrieval
- Natural Language Processing
- Reinforcement Learning
- Machine Learning Research
- Supervised Fine-Tuning
Возможные вопросы на собеседовании
Вопрос проверяет понимание специфики обучения с подкреплением в контексте LLM.
Как бы вы адаптировали стандартные алгоритмы RLHF для минимизации галлюцинаций в информационных запросах?
Оценка качества — ключевая часть роли; важно знать современные метрики.
Какие метрики, помимо стандартных ROUGE/BLEU, вы считаете наиболее эффективными для оценки фактологической точности ответов?
Роль включает работу с инструментами и поиском.
Опишите ваш опыт работы с Retrieval-Augmented Generation (RAG) и способы улучшения оркестрации вызовов внешних инструментов.
Проверка инженерных навыков в контексте масштабируемости.
С какими основными трудностями вы сталкивались при масштабировании SFT на моделях с параметрами 100B+?
Проверка способности критически мыслить и предлагать инновации.
Какое недавнее исследование в области post-training для LLM вы считаете наиболее перспективным для внедрения в Gemini?
Похожие вакансии
MLOps Engineer (Python)
AI Engineer (CV & Navigation)
Senior / Lead LLM Engineer
Python AI разработчик
Разработчик AI-агентов
Middle, Middle+, Senior GenAI/LLM Разработчик
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- США
- Зарплата
- 147 000 $ – 211 000 $