yandex
manifoldbio
Страна
США
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
В офисеПолная занятость

AI/ML Scientist – Protein Foundation Models

Оценка ИИ

Исключительная вакансия для ученых в области AI/ML: работа в передовом биотехе с уникальными данными, прямое влияние на разработку лекарств и сильный инженерный стек. Бостонский хаб обеспечивает отличную профессиональную среду.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Роль требует редкого сочетания глубоких знаний в области структурной биологии и продвинутых навыков ML (обучение трансформеров, диффузионных моделей и работа с распределенными системами). Высокая сложность обусловлена необходимостью работы с проприетарными биологическими данными и масштабированием моделей до уровня State-of-the-Art.

Анализ зарплаты

Медиана185 000 $
Рынок155 000 $ – 230 000 $
Оценка ИИ

Предлагаемая позиция в Бостоне соответствует верхнему эшелону рынка для специалистов уровня PhD или Senior ML Scientist в сфере Biotech. Рыночные оценки для таких ролей в США значительно выше средних по IT-сектору из-за дефицита кадров на стыке биологии и ИИ.

Сопроводительное письмо

I am writing to express my strong interest in the AI/ML Scientist position at Manifold Bio. With a deep background in training protein foundation models and extensive experience in large-scale distributed training using PyTorch, I am excited by the opportunity to enhance the mBER model and leverage your proprietary experimental datasets. My expertise in AlphaFold architectures and generative design methods like RFdiffusion aligns perfectly with your team's mission to push the boundaries of de novo binder design.

Throughout my career, I have focused on bridging the gap between complex machine learning architectures and real-world biological outcomes. I have a proven track record of implementing mixed-precision training and gradient checkpointing to optimize large-scale runs on multi-GPU clusters. I am particularly drawn to Manifold Bio because of your unique in vivo screening data, and I am eager to contribute to a team where AI directly accelerates the discovery of life-saving therapeutics.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в manifoldbio уже сейчас

Присоединяйтесь к команде Manifold Bio, чтобы обучать передовые модели на уникальных биологических данных и менять будущее разработки лекарств!

Описание вакансии

Position

Manifold's AI team is actively training protein foundation models on our proprietary experimental datasets. Our generative antibody design model, mBER, has already demonstrated controllable de novo binder design across multiple million-scale screening campaigns, and the team is now scaling foundation model capabilities to push well beyond current performance. We are looking for an AI/ML Scientist to join this effort. You will work alongside our existing model training team to accelerate the development of foundation models fine-tuned on Manifold's data, bringing additional depth in pre-training methodology, architecture development, and large-scale training. Your work will directly improve mBER's design capabilities and unlock new modeling paradigms for the broader team. You'll own foundation model projects end-to-end, from architecture selection and training infrastructure to evaluation against real experimental outcomes, while contributing to the team's shared research agenda.

Responsibilities

  • Advance the team's ongoing foundation model training efforts—pretraining, fine-tuning, and evaluating folding, docking, language, and generative design models on Manifold's proprietary experimental data
  • Bring depth in training methodology, architecture selection, and optimization to complement the existing team's expertise
  • Develop and scale training pipelines for distributed, multi-GPU and multi-node training runs
  • Integrate foundation model outputs into mBER to improve binder design success rates and enable new design capabilities
  • Design and execute ML experiments with clear hypotheses, rigorous evaluation frameworks, and systematic analysis
  • Establish best practices for mixed-precision training, gradient checkpointing, and computational efficiency at scale
  • Produce clear documentation and analysis supporting architecture and training decisions

Required Qualifications

  • Demonstrated experience pretraining and/or fine-tuning protein foundation models (folding, docking, language models, or generative design) with published or otherwise demonstrable results
  • Strong familiarity with AlphaFold architecture and training methodology
  • 2+ years of hands-on experience with PyTorch and/or JAX for deep learning
  • Experience with large-scale model training: distributed training, multi-GPU/multi-node setups, mixed precision, gradient checkpointing
  • Solid understanding of deep learning architectures (transformers, attention mechanisms, diffusion/flow matching) and optimization techniques
  • Experience working with protein structure data (PDB, mmCIF) and/or protein sequence datasets
  • Strong statistical analysis and experimental design skills
  • Proficiency in Python scientific computing stack (NumPy, Pandas, scikit-learn)
  • Self-directed researcher who can balance guidance with independence
  • Excellent written and verbal communication skills for cross-functional collaboration

Preferred Qualifications

  • Experience with protein generative design methods (e.g., RFdiffusion, ProteinMPNN, flow matching approaches)
  • Experience with protein language models (e.g., ESM family)
  • Published research in computational biology, protein design, or structural biology
  • Experience training on proprietary or domain-specific biological datasets
  • Familiarity with Ray for distributed computing
  • Experience with Kubernetes (EKS) and cloud computing platforms (AWS)
  • Knowledge of protein engineering, directed evolution, or structural biology wet lab techniques
  • Experience working with agentic AI coding tools for fast, parallelized execution of modeling experiments
  • Previous biotech/pharma industry experience

This Role Might Be Perfect For You If

  • You have deep experience training protein foundation models and want to apply that expertise to some of the richest proprietary experimental datasets in the field
  • You're excited about pushing beyond public model performance by leveraging unique, large-scale in vivo screening data
  • You thrive in high-ownership roles where you can drive research direction while collaborating with a tight-knit, world-class team
  • You want your models to directly impact real drug discovery programs

If you're excited to train the next generation of protein foundation models on uniquely powerful experimental data, please reach out to careers@manifold.bio.

We value different experiences and ways of thinking and believe the most talented teams are built by bringing together people of diverse cultures, genders, and backgrounds.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • PyTorch
  • JAX
  • Python
  • NumPy
  • Pandas
  • Scikit-learn
  • AlphaFold
  • Transformers
  • Diffusion Models
  • Distributed Training
  • Kubernetes
  • AWS
  • Ray
  • ProteinMPNN
  • RFdiffusion

Возможные вопросы на собеседовании

Проверка понимания архитектурных особенностей, критически важных для работы с белками.

Можете ли вы подробно описать механизмы внимания в AlphaFold и как бы вы адаптировали их для повышения эффективности генеративного дизайна?

Оценка практического опыта работы с высоконагруженными вычислениями.

С какими основными трудностями вы сталкивались при масштабировании обучения моделей на несколько узлов (multi-node) и как вы решали проблемы синхронизации градиентов?

Проверка навыков работы со специфическими биологическими данными.

Как вы подходите к обработке и нормализации проприетарных данных мокрой лаборатории перед их подачей в модель машинного обучения?

Оценка опыта в области генеративного дизайна.

В чем, по вашему мнению, заключаются основные преимущества и недостатки Flow Matching по сравнению с традиционными диффузионными моделями в контексте дизайна белков?

Проверка способности оценивать качество моделей вне стандартных метрик.

Как вы выстраиваете процесс валидации модели, чтобы гарантировать, что предсказанные структуры будут функциональны в реальных экспериментальных условиях?

Похожие вакансии

Omega Solutions
2 000 ₽ – 2 700 ₽

Senior Data инженер

SeniorУдалённоРоссия
Java · Groovy · Hadoop · ETL · DWH · SQL · Docker · Apache NiFi · Airflow · SAP HANA · Apache Kafka · Apache Iceberg · Python · Go · Linux · Ansible · Zabbix · HDFS · Hive
+19 навыков
Volna.tech
386 000 ₽ – 436 000 ₽

Senior MLOps Engineer (Platform Development / LLMOps)

SeniorУдалённоРоссия
Docker · Helm · Jenkins · GitLab CI · Python · Airflow · JupyterHub · MLflow · Seldon · CUDA · Kubernetes · Hadoop · Spark · Kafka · ELK · LLMOps · RAG
+17 навыков
LIAN
260 000 ₽ – 350 000 ₽

Data Engineer / SAP HANA Developer (Senior)

SeniorУдалённоРоссия
SAP HANA · Python · Go · Java · C++ · Rust · Apache Iceberg · Apache Paimon · Apache Kafka · SQL · SRE · Observability
+12 навыков
Купер
Не указана

Data Engineering Team Lead (команда Clickhouse)

LeadУдалённоРоссия
ClickHouse · SQL · Python · Airflow · MySQL · PostgreSQL · S3 · API · Kafka · Spark · Scala · Java · CI/CD
+13 навыков
Альфа-Банк (AlfaPredict, Feature Store)
Не указана

Senior MLOps

SeniorУдалённоРоссия
MLOps · DevOps · Docker · Helm · Jenkins · GitLab CI · Python · Airflow · JupyterHub · MLflow · Seldon Core · CUDA · Kubernetes · Hadoop · Apache Spark · Apache Kafka · ELK stack · LLMOps · AutoML
+19 навыков
Островок!
Не указана

Senior Data Scientist (Search)

SeniorУдалённоРоссия
Python · SQL · PyTorch · TensorFlow · MLflow · Weights & Biases · DVC · Airflow · Prefect · Dagster · Feature Engineering · Boosting · A/B Testing · Ranking Systems · Recommender Systems
+15 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

manifoldbio
Страна
США