yandex
gradientai
Страна
США
Зарплата
150 000 $ – 190 000 $
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
УдалённоПолная занятость

Staff Data Engineer

Оценка ИИ

Отличная вакансия в быстрорастущем стартапе с Series C финансированием. Предлагает конкурентную зарплату, опционы, неограниченный отпуск и возможность работать удаленно над общественно значимыми задачами в сфере HealthTech.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Высокая сложность обусловлена ролью уровня Staff, требующей более 7 лет опыта, глубоких знаний в области биоинформатики и медицинских данных (HIPAA, EHR), а также владения современным стеком (Spark, Databricks, Terraform).

Анализ зарплаты

Медиана175 000 $
Рынок145 000 $ – 210 000 $
Оценка ИИ

Предложенная зарплата ($150k-190k) полностью соответствует рыночным стандартам США для позиции Staff Data Engineer, особенно в секторе HealthTech. Верхняя граница диапазона является очень привлекательной для полностью удаленной работы.

Сопроводительное письмо

I am writing to express my strong interest in the Staff Data Engineer position at Gradient AI. With over 7 years of experience in building scalable data infrastructure and a deep background in processing complex healthcare datasets, I am confident in my ability to lead the refinement of your data platforms. My expertise in Python, SQL, and big data tools like Apache Spark and Databricks aligns perfectly with your mission to revolutionize the P&C and Group Health insurance industries.

In my previous roles, I have successfully designed and implemented robust ETL pipelines that handle millions of records while ensuring strict compliance with data privacy regulations. I am particularly drawn to Gradient AI's focus on using AI-powered solutions to predict risk and improve profitability. I am eager to bring my experience with modern orchestration frameworks like Airflow and DevOps practices to your team to help scale your data foundation and support advanced ML models.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в gradientai уже сейчас

Присоединяйтесь к Gradient AI, чтобы создавать будущее страхования на основе больших данных и ИИ — откликайтесь прямо сейчас!

Описание вакансии

*This is a fully remote opportunity.*

Gradient AI:  

Gradient AI is revolutionizing Group Health and P&C insurance with AI-powered solutions that help insurers predict risk more accurately, improve profitability, and automate underwriting and claims. Our SaaS platform taps into one of the industry’s largest data lakes—tens of millions of policies and claims—to deliver deep, actionable insights. Trusted by leading carriers, MGAs, TPAs, and self-insured employers, Gradient AI has grown rapidly since our founding in 2018. Backed by $56M in Series C funding, we're scaling fast—and it's an exciting time to join the team. 

About the Role:  

We are seeking a Staff Data Engineer to lead the improvement and refinement of scalable data infrastructure, data platforms, and data architecture that power our predictive analytics solutions. This role focuses on building reliable, high-performance data pipelines and orchestration frameworks that enable efficient data movement across systems. The ideal candidate brings deep expertise in modern data platforms, an understanding of big data tools, and distributed systems, paired with experience working with complex healthcare datasets (e.g., claims or clinical data). You’ll play a key role in shaping our data foundation, ensuring robustness, scalability, and operational excellence across the platform.

How you will make an impact: 

  • Design, build, and implement data systems to support ML and AI models for our health insurance clients, ensuring strict compliance with healthcare data privacy and security regulations (e.g., HIPAA).
  • Develop tools for extracting, processing, and profiling diverse healthcare data sources, including EHRs, medical claims, pharmacy data, and genomic data.
  • Collaborate with data scientists to transform large volumes of health-related and bioinformatics data into modeling-ready formats, prioritizing data quality, integrity, and reliability in healthcare applications.
  • Build and maintain infrastructure for the extraction, transformation, and loading (ETL) of data from a variety of sources using SQL, AWS, and healthcare-specific big data technologies and analytics platforms.
  • Ensure data pipelines meet the unique requirements of health, medical, and bioinformatics data processing, including translating complex medical and biological concepts into actionable data requirements.

 Skills needed to succeed:  

  • BS in Computer Science, Bioinformatics, or another quantitative discipline with 7+ years of relevant working experience.
  • Deep expertise in health, medical, and bioinformatics data, including real-world healthcare datasets, with a strong understanding of the complexities and challenges of processing medical and biological information.
  • Proficiency in Python and SQL within a professional environment.
  • Hands-on knowledge of big data tools like Apache Spark (PySpark), Databricks, Snowflake, or similar platforms
  • Experience with data orchestration frameworks such as Airflow, Dagster, or Prefect.
  • Experience with modern DevOps practices, including CI/CD, IaC (Terraform), containerization (Docker/Kubernetes), and cloud environments (AWS preferred).
  • Knowledge of data transformation tools, such as dbt, is a plus

What We Offer:  

  • A fun, team-oriented startup culture.
  • Generous stock options - we all get to own a piece of what we’re building.
  • Unlimited vacation days.
  • Flexible schedule that supports working from home.
  • Full benefits package includes medical, dental, vision, 401k, paid paternal leave, and more.
  • Ample opportunities to learn and take on new responsibilities.

We are an equal opportunity employer. 

Salary Range: $150,000-190,000 base salary annually. 

This role is also eligible for an annual performance bonus, equity grant, and a comprehensive benefits package. In accordance with the Massachusetts Pay Transparency Law, we are providing a good-faith salary range for this position at the time of posting. The actual salary offered will depend on the level at which the candidate is hired, as well as their experience, skills, qualifications, and location. Compensation may grow over time through merit-based increases, promotions, and company-wide adjustments. If your salary expectations fall outside this range, we still encourage you to apply so we can have a conversation.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • SQL
  • Apache Spark
  • PySpark
  • Databricks
  • Snowflake
  • Airflow
  • Dagster
  • Prefect
  • AWS
  • Terraform
  • Docker
  • Kubernetes
  • dbt
  • CI/CD
  • Bioinformatics

Возможные вопросы на собеседовании

Проверка опыта работы с чувствительными данными в регулируемой среде.

Как вы обеспечиваете соблюдение требований HIPAA и безопасность данных при проектировании ETL-процессов для медицинских записей?

Оценка навыков проектирования масштабируемых систем.

Опишите ваш опыт оптимизации производительности в Apache Spark при обработке терабайтных объемов данных медицинских заявок.

Проверка архитектурного мышления и выбора инструментов.

Почему вы бы выбрали Dagster или Prefect вместо Airflow для оркестрации сложных пайплайнов в контексте Gradient AI?

Оценка умения работать с «грязными» данными.

С какими основными проблемами качества данных вы сталкивались при работе с EHR или клиническими данными и как вы их решали?

Проверка навыков взаимодействия с Data Science командами.

Как вы организуете процесс подготовки признаков (feature engineering) для ML-моделей, чтобы обеспечить воспроизводимость и высокую скорость инференса?

Похожие вакансии

Aston
Не указана

ML Engineer

УдалённоРоссия
Python · PyTorch · LightGBM · XGBoost · CatBoost · Scikit-learn · Pandas · NumPy · Apache Spark · Hadoop · Apache Hive · MLflow · Apache Airflow · Argo Workflows
+14 навыков
Купер
Не указана

Data-Scientist (команда динамического ценообразования)

УдалённоРоссия
Python · SQL · Exploratory Data Analysis · Machine Learning · Prototyping
+5 навыков
Сбер (Большой зелёный банк)
313 500 ₽ – 504 500 ₽

Senior Data Scientist

SeniorГибридРоссия
Python · PyTorch · NumPy · Pandas · Scikit-learn · LLM · BERT · NLP · MLOps · FastAPI · Kafka · Redis · Kubernetes · Docker · SQL · Hadoop · Spark · Git
+18 навыков
Сбербанк
243 700 ₽ – 316 600 ₽

Middle Data Scientist

MiddleГибридРоссия
Python · NLP · LLM · BERT · PyTorch · NumPy · Pandas · Scikit-learn · FastAPI · Kafka · Redis · Kubernetes · Docker · SQL · Hadoop · Spark · Git
+17 навыков
Билайн
Не указана

Старший аналитик AI/ML

SeniorУдалённоРоссия
Big Data · Hadoop · Apache Spark · PostgreSQL · SQL · Python · MLOps · Neural Networks · LLM · Prompt Engineering · Git · GitLab · Linux · Qlik Sense
+14 навыков
Oneeven
Не указана

Senior Data Engineer

SeniorУдалённо
Python · Apache Airflow · SQL · ClickHouse · PostgreSQL · AWS S3 · Nextcloud · ETL · ELT · Data Quality · Git
+11 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

gradientai
Страна
США
Зарплата
150 000 $ – 190 000 $