yandex
medeloop
Страна
США
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorВ офисеПолная занятость

Senior AI Data Engineer– Agentic Healthcare Platform

Оценка ИИ

Отличная вакансия для Senior-специалиста: работа над социально значимым продуктом, использование передового стека (AI agents, RAG), наличие огромного массива данных (200M+ записей) и прямое влияние на продукт без лишней бюрократии.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Высокая сложность обусловлена необходимостью глубоких знаний в узкой нише: медицинские онтологии (SNOMED, UMLS) и стандарты данных (OMOP, FHIR), а также требованием уже иметь опыт использования AI-инструментов для автоматизации разработки.

Анализ зарплаты

Медиана185 000 $
Рынок160 000 $ – 220 000 $
Оценка ИИ

Зарплата в вакансии не указана, но для роли Senior Data Engineer в Сан-Франциско в сфере AI/HealthTech рыночные показатели являются одними из самых высоких в мире. Учитывая стадию Series A и требования к экспертизе, можно ожидать конкурентный пакет с опционами.

Сопроводительное письмо

I am writing to express my strong interest in the Senior AI Data Engineer position at Medeloop. With extensive experience in architecting data pipelines and a deep understanding of healthcare common data models like OMOP and FHIR, I am excited by the prospect of building the data backbone for your AI Scientist platform. My background in integrating AI-native workflows and NLP techniques aligns perfectly with your mission to automate complex medical research processes.

In my previous roles, I have successfully managed large-scale healthcare datasets, ensuring high data quality and semantic richness for downstream AI applications. I am particularly drawn to Medeloop's approach of using agentic frameworks to handle unstructured clinical data. I am confident that my technical leadership and hands-on experience with Spark, RAG, and medical ontologies will allow me to contribute immediately to your ambitious goals and help scale your 200M+ patient record data asset.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в medeloop уже сейчас

Присоединяйтесь к Medeloop, чтобы создавать AI-инфраструктуру, которая реально ускоряет медицинские исследования и разработку лекарств!

Описание вакансии

The Role

This is a full-ownership data engineering role at the center of Medeloop's AI platform. You won't be maintaining pipelines someone else built,  you'll be architecting the data backbone that powers AI agents doing real operations at scale. You'll work directly with data scientists, AI engineers, and product teams to turn raw, complex healthcare data into the clean, structured, semantically-rich foundation our AI scientists depend on. Your work shows up in customer products and research outcomes, not internal dashboards that no one reads.Candidates who currently perform these tasks exclusively through manual processes are unlikely to be suitable for this role. We require an individual who has already adopted and integrated AI techniques to enhance operational velocity, rather than one who is contemplating future experimentation.If you want to build something that genuinely changes how medical research gets done, this is the role.

What You'll Own

  • The healthcare data lake: curating, extending, and evolving it through new concepts, derived variables, and data models that directly inform our AI engines and customer products
  • AI-native data workflows: designing and operating AI-powered pipelines (using tools like Claude Code and agent frameworks) to automate harmonization, cleaning, quality checks, and summarization at scale
  • NLP and semantic infrastructure: building pipelines for entity extraction, concept normalization, embedding-based retrieval, and semantic search that power the AI Scientist platform
  • Novel data extraction approaches: experimenting with and building new methodologies for working with unstructured clinical data, not just applying existing playbooks
  • Research-grade data products: delivering analytical samples, cohorts, and final datasets that withstand scientific scrutiny and are actively used by researchers and customers
  • Data governance and observability protocols: including access controls, PHI/PII handling, data classification, compliance, monitoring, alerting, data freshness, and comprehensive documentation to enable self-service capabilities.

What We're Looking For

  • 3+ years of relevant data engineering or data management within an analytics-driven organization, with end-to-end ownership from raw ingestion to final data product
  • Deep hands-on experience with healthcare CDMs (OMOP, FHIR, PCORnet) — designing or extending them, not just querying
  • Knowledge of medical ontologies: UMLS, SNOMED CT, RxNorm
  • Experience with big data, data pipelines and tooling that support retrieval-augmented generation (RAG), vector integrations, embedding workflows, and other AI/ML workloads. Experience in big data tooling such as Spark, Iceberg, EMR
  • Fluent in Python and SQL; comfortable across structured and unstructured data
  • Proven NLP experience: semantic search, entity recognition, concept normalization, embedding pipelines
  • Strong grasp of inferential statistics and cohort methodology to be a real partner to data scientists and customers (as part of onboarding)
  • Experience contributing to an AI/ML product, especially in automated research or scientific discovery
  • Experience mentoring other engineers and providing technical leadership

Bonus Points

  • Multi-cloud experience (AWS, Azure, GCP)
  • Authorship or contribution to peer-reviewed publications or technical reports

Why Medeloop

  • Ownership from day one: small team, high-trust, no layers between your work and its impact
  • Technically ambitious: you'll build AI-powered workflows, not just support them
  • Real-world stakes: your work accelerates drug development, addresses health equity, and improves clinical research for institutions that matter
  • Strong foundation: Series A, top-tier investors, and a data asset (200M+ patient records) that most companies spend years trying to build
+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • SQL
  • Apache Spark
  • Apache Iceberg
  • AWS
  • NLP
  • RAG
  • FHIR
  • OMOP
  • SNOMED-CT
  • UMLS
  • Medical Ontologies
  • Data Governance
  • ETL

Возможные вопросы на собеседовании

Проверка практического опыта работы со специфическими медицинскими стандартами, упомянутыми в вакансии.

Расскажите о вашем опыте проектирования или расширения моделей данных OMOP или FHIR. С какими основными сложностями вы сталкивались при маппинге сырых клинических данных?

Вакансия требует использования AI для ускорения разработки. Важно понять, как кандидат применяет эти инструменты.

Как именно вы используете AI-инструменты (например, Claude Code или агентные фреймворки) в своем текущем рабочем процессе для автоматизации очистки или гармонизации данных?

Роль подразумевает работу с RAG и семантическим поиском.

Опишите ваш подход к построению пайплайнов для генерации эмбеддингов и обеспечения качества поиска в системах RAG на основе медицинских текстов.

Работа с медицинскими данными требует строгого соблюдения конфиденциальности.

Какие протоколы и инструменты вы используете для обработки PHI/PII и обеспечения соответствия требованиям HIPAA при масштабировании данных в облаке?

Проверка навыков работы с большими данными и современным стеком.

В каких сценариях вы бы предпочли использовать Apache Iceberg вместо традиционных решений в контексте работы с медицинскими данными в AWS/Azure?

Похожие вакансии

JETLYN
310 000 ₽ – 430 000 ₽

AI Engineer (CV & Navigation)

SeniorУдалённоРоссия
Computer Vision · Python · PyTorch · TensorFlow · SLAM · Deep Learning · Augmented Reality
+7 навыков
NDA
Не указана

Middle, Middle+, Senior GenAI/LLM Разработчик

SeniorУдалённоРоссия
n8n · JSON · PostgreSQL · REST · GraphQL · OAuth2 · FastAPI · JavaScript · TypeScript · React · Python · LangChain · RAG · pgvector · Qdrant · Milvus · Prompt Engineering
+17 навыков
QLAN
Не указана

Middle / Senior GenAI Engineer (CV)

SeniorУдалённоРоссия
Computer Vision · Diffusion Models · Stable Diffusion · SDXL · LoRA · UNet · Python · PyTorch · Machine Learning · Image Generation · Video Generation
+11 навыков
Золотое Яблоко
Не указана

Senior / Lead LLM Engineer

SeniorУдалённоРоссия
Python · LLM · Generative AI · RAG · Vector Databases · Machine Learning · Information Retrieval · NLP
+8 навыков
Aiuta
6 000 € – 8 000 €

Senior Computer Vision Engineer

SeniorУдалённоКипр
Python · PyTorch · Computer Vision · Diffusion Models · Generative Adversarial Networks · Machine Learning
+6 навыков
NDA
Не указана

AI Platform Engineer (RAG/Agents/Skills)

SeniorУдалённоАрмения
Python · SQL · FastAPI · LangGraph · LlamaIndex · Haystack · Semantic Kernel · Qdrant · pgvector · Weaviate · Milvus · OpenSearch · ElasticSearch · Airflow · Prefect · Dagster · Temporal · Langfuse · OpenTelemetry · Docker · Kubernetes · CI/CD · RAG · LLM
+24 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

medeloop
Страна
США