Страна: Франция

+500% приглашений

Откликайтесь
на вакансии с ИИ

SeniorГибридПолная занятость

Senior/Staff Machine Learning Engineer - Health Evaluation - AI Teams (x/f/m)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Отличная вакансия в одной из ведущих health-tech компаний Европы. Предлагает работу над сложными задачами на острие технологий (Agentic AI), сильный социальный пакет и прозрачный процесс найма.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена требованиями к глубокому опыту (7+ лет) в области LLM и специфическим фокусом на оценке (evaluation) агентных систем, что является передовым краем индустрии. Процесс отбора включает системный дизайн данных и глубокие технические интервью.

Анализ зарплаты

Медиана115 000 €

Рынок95 000 € – 140 000 €

Предлагаемая роль Senior/Staff уровня в Париже соответствует верхнему сегменту рынка. Для Staff-позиций в топовых технологических компаниях Франции зарплаты часто превышают 100-120 тысяч евро в год плюс бонусы и опционы.

I am writing to express my strong interest in the Senior/Staff Machine Learning Engineer position within the Health Evaluation team at Doctolib. With over 7 years of experience in machine learning and a deep focus on LLM architectures, I have developed a keen interest in the challenges of evaluating agentic systems. My background in designing automated evaluation pipelines and defining robust metrics for complex reasoning models aligns perfectly with your mission to build a safe and reliable AI Health Companion.

In my previous roles, I have successfully bridged the gap between research and production, ensuring that LLM-based applications meet high standards of factuality and robustness. I am particularly drawn to Doctolib's ethical approach to AI and the opportunity to apply my technical expertise to the healthcare sector, where precision and safety are paramount. I am eager to bring my experience in experiment design and evaluation automation to your cross-functional team and contribute to the evolution of healthcare technology.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в doctolib уже сейчас

Присоединяйтесь к Doctolib, чтобы создавать безопасные ИИ-решения, которые меняют будущее европейского здравоохранения!

Описание вакансии

What you’ll do

At Doctolib, we're on a mission to transform how healthcare is delivered by harnessing the power of AI.

As a Senior/Staff Machine Learning Engineer, you’ll play a key role in designing, implementing, and scaling the evaluation framework that ensures our AI Health Companion behaves safely, reliably, and helpfully for millions of patients and practitioners.

You’ll join a cross-functional team of Machine Learning Engineers, Product Engineers, and Medical Experts to build robust evaluation pipelines for agentic AI systems — models capable of reasoning, planning, and interacting with complex healthcare data.

Your responsibilities include, but are not limited to:

Define and own the evaluation strategy for our AI agentic system - metrics, protocols, datasets, and tooling
Implement and maintain automated evaluation pipelines to monitor model quality, safety, and alignment across iterations
Run systematic experiments to assess reasoning, factuality, robustness, and user experience
Collaborate closely with model developers and research scientists to provide insights and drive iterative improvement
Contribute to research and internal knowledge sharing on LLM evaluation methodologies and best practices

About our tech environment

Our solutions are built on a single fully cloud-native platform that supports web and mobile app interfaces, multiple languages, and is adapted to the country and healthcare specialty requirements. To address these challenges, we are modularizing our platform run in a distributed architecture through reusable components
Our stack is composed of Rails, TypeScript, Java, Python, Kotlin, Swift, and React Native
We leverage AI ethically across our products to empower patients and health professionals. Discover our AI visionhere!

Who you are

Before you read on — if you don't have the exact profile described below, but you feel this job description matches your skill set, we still encourage you to apply.

MSc or PhD in Computer Science, Machine Learning, Data Science, or related field
7+ years of hands-on experience working with large language models (e.g., GPT, Claude, Llama, or BERT-like architectures)
Proven experience in evaluating agentic or reasoning systems (e.g., autonomous agents, tool-using LLMs, dialogue systems, or task-oriented assistants)
Strong track record in experiment design, metric definition, and evaluation automation
Ability to bridge research and production, influencing modeling and product decisions
Excellent communication skills and a collaborative mindset

Now it would be fantastic if:

You have experience in the clinical or medical domain and sensitivity to ethical or regulatory challenges in healthcare AI

What we offer

Free health insurance for you and your children
Parent Care Program: receive one additional month of leave on top of the legal parental leave
Free mental health and coaching services through our partner Moka.care
For caregivers and workers with disabilities, a package including an adaptation of the remote policy, extra days off for medical reasons, and psychological support
Work from EU countries and the UK for up to 10 days per year, thanks to our flexibility days policy
Work Council subsidy to refund part of sport club membership or creative class
Up to 14 days of RTT
Lunch voucher with Swile card

The interview process

Recruiter interview
Technical Deep Dive
Data System Design
Behavioral Interview
At least one reference check

Job details

Permanent position
Full Time
Workplace : Hybrid in our Levallois office
Start date: asap

At Doctolib, we are committed to improving access to healthcare for everyone. This translates into our recruitment process. We evaluate candidates based solely on qualifications and motivation, without any form of discrimination. The more diverse ideas are heard, the more our product will truly improve healthcare for all.

You are welcome to apply to Doctolib, regardless of your gender, religion, age, sexual orientation, ethnicity, disability. To ensure equal opportunities, we invite you to exclude personal information (e.g. pictures, age) from your applications. If you require any accommodation, please let us know for support during the hiring process.

All information provided is processed by Doctolib for application management. For data processing details, click here.Please contact hr.dataprivacy(at)doctolib.com for inquiries or to exercise your rights.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Machine Learning
Large Language Models
Python
Generative AI
LLM Evaluation Systems
Experiment Design
Data Science
Agentic AI
NLP

Возможные вопросы на собеседовании

Позиция сфокусирована на оценке агентных систем, поэтому важно понимать, как кандидат измеряет успех в условиях неопределенности.

Как бы вы спроектировали систему оценки для медицинского ИИ-агента, который должен уметь рассуждать и использовать внешние инструменты? Какие метрики будут ключевыми?

В здравоохранении галлюцинации критичны. Вопрос проверяет опыт работы с надежностью моделей.

Какие методы вы используете для автоматического обнаружения фактических ошибок и галлюцинаций в ответах LLM в специфических доменах?

Роль подразумевает масштабирование процессов оценки.

Опишите ваш опыт создания автоматизированных пайплайнов оценки (LLM-as-a-judge, human-in-the-loop). С какими проблемами масштабирования вы сталкивались?

Проверка способности работать на стыке продукта и науки.

Как вы транслируете результаты экспериментов по оценке качества в конкретные рекомендации для команды разработчиков моделей?

Проверка этической составляющей и понимания специфики отрасли.

Как вы подходите к оценке предвзятости (bias) и безопасности моделей в контексте медицинских данных и различных групп пациентов?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Франция

Откликайтесь
на вакансии с ИИ

Senior/Staff Machine Learning Engineer - Health Evaluation - AI Teams (x/f/m)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в doctolib уже сейчас

Описание вакансии

What you’ll do

About our tech environment

Who you are

What we offer

The interview process

Job details

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие методы вы используете для автоматического обнаружения фактических ошибок и галлюцинаций в ответах LLM в специфических доменах?

Опишите ваш опыт создания автоматизированных пайплайнов оценки (LLM-as-a-judge, human-in-the-loop). С какими проблемами масштабирования вы сталкивались?

Как вы транслируете результаты экспериментов по оценке качества в конкретные рекомендации для команды разработчиков моделей?

Как вы подходите к оценке предвзятости (bias) и безопасности моделей в контексте медицинских данных и различных групп пациентов?

Похожие вакансии

Архитектор мультиагентных систем на базе LLM

AI engineer (ML/DS)

Python-разработчик в команду запуска внутренних AI-сервисов

Аналитик AI-агентов Senior

Аналитик AI-агентов

AI-разработчик (Senior)

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Senior/Staff Machine Learning Engineer - Health Evaluation - AI Teams (x/f/m)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в doctolib уже сейчас

Описание вакансии

What you’ll do

About our tech environment

Who you are

What we offer

The interview process

Job details

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие методы вы используете для автоматического обнаружения фактических ошибок и галлюцинаций в ответах LLM в специфических доменах?

Опишите ваш опыт создания автоматизированных пайплайнов оценки (LLM-as-a-judge, human-in-the-loop). С какими проблемами масштабирования вы сталкивались?

Как вы транслируете результаты экспериментов по оценке качества в конкретные рекомендации для команды разработчиков моделей?

Как вы подходите к оценке предвзятости (bias) и безопасности моделей в контексте медицинских данных и различных групп пациентов?

Похожие вакансии

Архитектор мультиагентных систем на базе LLM

AI engineer (ML/DS)

Python-разработчик в команду запуска внутренних AI-сервисов

Аналитик AI-агентов Senior

Аналитик AI-агентов

AI-разработчик (Senior)

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ