- Страна
- Канада
Откликайтесь
на вакансии с ИИ

Senior AI Data Engineer– Agentic Healthcare Platform
Исключительная вакансия для Senior-специалиста: работа с огромным массивом реальных данных (200M+ записей), прямой вклад в науку и медицину, использование передового стека (AI-агенты) и отсутствие бюрократии.
Сложность вакансии
Высокая сложность обусловлена требованием глубоких знаний в узкой нише (медицинские онтологии OMOP/FHIR) и ожиданием того, что кандидат уже активно использует AI-инструменты (Claude Code, агенты) в своей работе.
Анализ зарплаты
Зарплата в вакансии не указана, но для Senior Data Engineer в Монреале с такой узкой специализацией (HealthTech + AI) рыночные показатели начинаются от 140k CAD. Учитывая стадию Series A и высокие требования, можно ожидать конкурентный пакет, включающий опционы.
Сопроводительное письмо
I am writing to express my strong interest in the Senior AI Data Engineer position at Medeloop. With a robust background in architecting data backbones for AI-driven platforms and deep expertise in healthcare data models like OMOP and FHIR, I am eager to contribute to your mission of transforming medical research through agentic AI.
In my previous roles, I have successfully integrated AI-native workflows to automate data harmonization and quality checks, moving beyond manual processes to achieve high operational velocity. My experience with RAG, vector databases, and medical ontologies such as SNOMED CT aligns perfectly with your need for a foundation that powers AI scientists. I am particularly drawn to Medeloop's high-trust environment and the opportunity to work with a massive dataset of 200M+ patient records to drive real-world clinical outcomes.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в medeloop уже сейчас
Присоединяйтесь к Medeloop, чтобы создавать AI-инфраструктуру, которая реально ускоряет медицинские исследования и разработку лекарств!
Описание вакансии
The Role
This is a full-ownership data engineering role at the center of Medeloop's AI platform. You won't be maintaining pipelines someone else built, you'll be architecting the data backbone that powers AI agents doing real operations at scale. You'll work directly with data scientists, AI engineers, and product teams to turn raw, complex healthcare data into the clean, structured, semantically-rich foundation our AI scientists depend on. Your work shows up in customer products and research outcomes, not internal dashboards that no one reads.Candidates who currently perform these tasks exclusively through manual processes are unlikely to be suitable for this role. We require an individual who has already adopted and integrated AI techniques to enhance operational velocity, rather than one who is contemplating future experimentation.If you want to build something that genuinely changes how medical research gets done, this is the role.
What You'll Own
- The healthcare data lake: curating, extending, and evolving it through new concepts, derived variables, and data models that directly inform our AI engines and customer products
- AI-native data workflows: designing and operating AI-powered pipelines (using tools like Claude Code and agent frameworks) to automate harmonization, cleaning, quality checks, and summarization at scale
- NLP and semantic infrastructure: building pipelines for entity extraction, concept normalization, embedding-based retrieval, and semantic search that power the AI Scientist platform
- Novel data extraction approaches: experimenting with and building new methodologies for working with unstructured clinical data, not just applying existing playbooks
- Research-grade data products: delivering analytical samples, cohorts, and final datasets that withstand scientific scrutiny and are actively used by researchers and customers
- Data governance and observability protocols: including access controls, PHI/PII handling, data classification, compliance, monitoring, alerting, data freshness, and comprehensive documentation to enable self-service capabilities.
What We're Looking For
- 3+ years of relevant data engineering or data management within an analytics-driven organization, with end-to-end ownership from raw ingestion to final data product
- Deep hands-on experience with healthcare CDMs (OMOP, FHIR, PCORnet) — designing or extending them, not just querying
- Knowledge of medical ontologies: UMLS, SNOMED CT, RxNorm
- Experience with big data, data pipelines and tooling that support retrieval-augmented generation (RAG), vector integrations, embedding workflows, and other AI/ML workloads. Experience in big data tooling such as Spark, Iceberg, EMR
- Fluent in Python and SQL; comfortable across structured and unstructured data
- Proven NLP experience: semantic search, entity recognition, concept normalization, embedding pipelines
- Strong grasp of inferential statistics and cohort methodology to be a real partner to data scientists and customers (as part of onboarding)
- Experience contributing to an AI/ML product, especially in automated research or scientific discovery
- Experience mentoring other engineers and providing technical leadership
Bonus Points
- Multi-cloud experience (AWS, Azure, GCP)
- Authorship or contribution to peer-reviewed publications or technical reports
Why Medeloop
- Ownership from day one: small team, high-trust, no layers between your work and its impact
- Technically ambitious: you'll build AI-powered workflows, not just support them
- Real-world stakes: your work accelerates drug development, addresses health equity, and improves clinical research for institutions that matter
- Strong foundation: Series A, top-tier investors, and a data asset (200M+ patient records) that most companies spend years trying to build
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- SQL
- RAG
- NLP
- Spark
- Apache Iceberg
- FHIR
- Data Governance
- Vector Databases
- OMOP
- RxNorm
- UMLS
- SNOMED-CT
- AWS EMR
Возможные вопросы на собеседовании
Проверка практического опыта работы со специфическими медицинскими стандартами, указанными в вакансии.
Расскажите о вашем опыте проектирования или расширения моделей данных OMOP или FHIR. С какими основными сложностями вы сталкивались при маппинге сырых клинических данных?
Вакансия делает упор на 'AI-native' подход. Важно понять, как кандидат автоматизирует свою работу.
Как именно вы используете AI-инструменты (например, LLM или агентные фреймворки) для автоматизации очистки данных и проверки их качества? Приведите пример из практики.
Оценка навыков построения инфраструктуры для современных AI-решений.
Опишите ваш опыт создания пайплайнов для RAG (Retrieval-Augmented Generation). Как вы подходите к индексации и семантическому поиску по неструктурированным медицинским текстам?
Работа в стартапе требует понимания того, как данные влияют на конечный продукт.
Как вы обеспечиваете 'исследовательское качество' данных, чтобы они могли выдержать научную проверку и использоваться в публикациях?
Проверка навыков работы с большими данными в облачной среде.
Какой стек технологий (Spark, Iceberg и т.д.) вы бы выбрали для обработки 200 млн записей пациентов и почему?
Похожие вакансии
AI Engineer (CV & Navigation)
Senior / Lead LLM Engineer
Middle, Middle+, Senior GenAI/LLM Разработчик
Senior Python AI Developer
GenAI/LLM Разработчик
Middle / Senior GenAI Engineer (CV)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Канада