yandex
deepmind
Страна
США
Зарплата
147 000 $ – 211 000 $
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
В офисеПолная занятость

Research Scientist, Response Quality/Hermes

Оценка ИИ

Это вакансия в одной из самых престижных ИИ-лабораторий мира с конкурентной зарплатой, бонусами и возможностью влиять на продукты, которыми пользуются миллионы. Идеальное сочетание фундаментальной науки и продуктового влияния.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Высокая сложность обусловлена требованием степени PhD и глубокой экспертизы в области RL и SFT для LLM. Работа в DeepMind предполагает конкуренцию с ведущими мировыми исследователями и решение фундаментальных задач ИИ.

Анализ зарплаты

Медиана190 000 $
Рынок160 000 $ – 250 000 $
Оценка ИИ

Предложенная вилка в $147k–$211k является базовой и соответствует рыночным стандартам для Research Scientist в Кремниевой долине. Однако с учетом бонусов и акций (equity), которые являются стандартной частью компенсации в DeepMind, совокупный доход будет значительно выше медианы рынка.

Сопроводительное письмо

I am writing to express my strong interest in the Research Scientist position within the Response Quality/Hermes team at Google DeepMind. With a PhD focused on large language models and a proven track record of research in post-training methodologies, I have closely followed the evolution of Gemini. My background in Reinforcement Learning and Supervised Fine-Tuning aligns perfectly with your mission to enhance the helpfulness and factuality of information-seeking responses.

In my previous research, I have developed novel evaluation frameworks and optimization techniques that directly address the challenges of model grounding and hallucination. I am particularly excited about the opportunity to work on post-training innovations that impact global products like AI Studio and Vertex AI. My strong software engineering skills ensure that I can not only conceptualize advanced research ideas but also implement them efficiently within Google's large-scale infrastructure.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в deepmind уже сейчас

Присоединяйтесь к команде Google DeepMind и определяйте будущее Gemini в задачах поиска и обработки информации!

Описание вакансии

Research Scientist, Response Quality/Hermes

Mountain View, CA

Snapshot

We are looking for a research scientist who will drive research in Gemini for information tasks. The candidate will primarily work on post-training, but could potentially also work on model-external interventions.

About Us

Our team works on improving Gemini on tasks where users interact with the model to complete information journeys;  this includes improving helpfulness and factuality of Gemini models.  To this end, we have developed novel post-training innovations to improve the quality, groundedness and factuality of Gemini models in search on mode.  Our work impacts product surfaces including AI Mode, Gemini App, AI Studio and Vertex AI.

The Role

In this role, we expect the candidate to work on improving Gemini for information tasks, focusing on quality of information-seeking responses (helpfulness, factuality, grounding, and other aspects). It is an opportunity to explore fundamental issues in modeling and data interventions for information-seeking scenarios, with very significant opportunities in shaping Google’s products in this space.

Key responsibilities:

  • Research on post-training (e.g., RL and SFT) for information-seeking scenarios in Gemini
  • Research on novel evaluation methods for improving model quality, grounding and factuality
  • Research on orchestration of tool calls, and improved retrieval methods, for information-seeking scenarios

About You

In order to set you up for success as a  at Google DeepMind,  we look for the following skills and experience:

  • PhD in a relevant area, or an equivalent research/publication record
  • Number of years experience: anything from recent PhD onwards
  • Strong software-engineering skills in addition to a research background

In addition, the following would be an advantage: (require maximum of 5 and minimum of 3 items)

  • Experience in reinforcement learning
  • Experience in post-training methods
  • Experience in LLMs for information-seeking scenarios

The US base salary range for this full-time position is between $147,000 USD - 211,000  + bonus + equity + benefits. Your recruiter can share more about the specific salary range for your targeted location during the hiring process.

Note: In the event your application is successful and an offer of employment is made to you, any offer of employment will be conditional on the results of a background check, performed by a third party acting on our behalf. For more information on how we handle your data, please see ourApplicant and Candidate Privacy Policy.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • Large Language Models
  • Information Retrieval
  • Natural Language Processing
  • Reinforcement Learning
  • Machine Learning Research
  • Supervised Fine-Tuning

Возможные вопросы на собеседовании

Вопрос проверяет понимание специфики обучения с подкреплением в контексте LLM.

Как бы вы адаптировали стандартные алгоритмы RLHF для минимизации галлюцинаций в информационных запросах?

Оценка качества — ключевая часть роли; важно знать современные метрики.

Какие метрики, помимо стандартных ROUGE/BLEU, вы считаете наиболее эффективными для оценки фактологической точности ответов?

Роль включает работу с инструментами и поиском.

Опишите ваш опыт работы с Retrieval-Augmented Generation (RAG) и способы улучшения оркестрации вызовов внешних инструментов.

Проверка инженерных навыков в контексте масштабируемости.

С какими основными трудностями вы сталкивались при масштабировании SFT на моделях с параметрами 100B+?

Проверка способности критически мыслить и предлагать инновации.

Какое недавнее исследование в области post-training для LLM вы считаете наиболее перспективным для внедрения в Gemini?

Похожие вакансии

более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

deepmind
Страна
США
Зарплата
147 000 $ – 211 000 $