yandex
mentis
Страна
Великобритания
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
В офисеПолная занятость

Member of Technical Staff (Applied AI)

Оценка ИИ

Уникальная возможность работать над фундаментальными проблемами надежности ИИ в Лондоне. Высокая степень автономности, работа с передовыми моделями и прямое влияние на продукт делают эту вакансию крайне привлекательной для амбициозных инженеров.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Роль требует не только глубоких технических знаний в области LLM и RL, но и способности работать на стыке инженерии и предметных областей (финансы, медицина). Высокий уровень ответственности и отсутствие четких спецификаций делают позицию сложной для кандидатов без опыта в стартапах.

Анализ зарплаты

Медиана90 000 £
Рынок70 000 £ – 115 000 £
Оценка ИИ

Для позиции Member of Technical Staff в AI-стартапе Лондона рыночный диапазон составляет £70,000–£110,000 в год. Учитывая специфику Applied AI и работу в офисе, компенсация может включать значительный опционный пакет.

Сопроводительное письмо

I am writing to express my strong interest in the Member of Technical Staff (Applied AI) position at Mentis. With a solid background in building agentic harnesses and a practical approach to LLM evaluation, I am drawn to your mission of making AI reliable in high-stakes domains like finance and healthcare. I thrive in high-agency environments where ownership is the default, and I am eager to apply my engineering skills to bridge the gap between complex professional workflows and verifiable task environments.

In my previous projects, I have focused on creating robust evaluation pipelines and moving beyond simple notebooks to production-ready systems. I am particularly excited about the opportunity to collaborate with domain experts to design reward functions and verification logic that define the ground truth for frontier models. My bias toward action and experience in iterating quickly align perfectly with the fast-paced, lean team structure at Mentis.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в mentis уже сейчас

Присоединяйтесь к команде в Лондоне и создавайте среду обучения для ИИ нового поколения в самых ответственных отраслях!

Описание вакансии

About Aptura

We build the evaluation datasets and RL environments that make AI reliable in domains where mistakes are expensive: finance, healthcare, and legal. Our team designs expert-curated training data, calibrated rubrics, and verifiable task environments for AI labs and startups pushing the frontier of what models can do in regulated industries.

We're a small, lean, London based team that moves fast and takes the work seriously. Everyone contributes directly. Initiative is rewarded, and ownership is the default. If you want to shape how frontier AI learns to operate in the real world, we'd like to hear from you.

About the Role

As a Member of Technical Staff on our Applied AI team, you will build the tasks and environments that AI labs use to train and evaluate their agents in finance, healthcare, and legal.

Day to day, that looks like: constructing RL environments around spreadsheets, documents, and professional workflows. Writing verification logic and reward functions. Working with domain experts to scope what a correct answer actually looks like in an LBO model or a clinical note. Some days it's engineering, some days it's closer to research. The common thread is that you're producing the ground truth that frontier models get measured against.

What You'll Do

  • Build RL environments across finance, healthcare, and legal domains
  • Assist in designing tasks with golden answers, calibrated rubrics, and programmatic reward signals
  • Write verification logic and reward functions that can distinguish good model outputs from bad ones
  • Work directly with domain experts (investment analysts, physicians, attorneys) to translate complex professional workflows into structured tasks
  • Prototype new approaches to evaluation, verification, and synthetic data generation

Who We're Looking For

  • Practical experience building with LLMs: prompting, evaluation, and agentic harnesses. You've built things that actually run, not just notebooks.
  • High agency and technically sharp. You don't wait for permission, specs, or a roadmap. You see what needs doing, figure out how, and get it done.
  • Comfortable working across very different contexts. The job moves between engineering, evaluation design, and deep collaboration with domain experts often in the same day.
  • You ship and iterate. Small team, no room for work that sits in review. Bias toward getting something working, learning from it, and improving it.
  • You own problems end to end, from scoping with a domain expert through to a working environment. If you prefer clearly partitioned tickets, this probably isn't the right fit.
  • Already using LLMs as part of how you build, not just as the thing you're building for.

Nice to Have

  • Domain knowledge in finance, healthcare, or legal
  • Familiarity with RL concepts, model training, and post-training workflows
  • Cloud infrastructure experience (AWS or GCP)
  • Previous startup experience, especially as an early engineer
+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • AWS
  • Python
  • LLM
  • Prompt Engineering
  • Google Cloud Platform
  • Reinforcement Learning
  • Evaluation Frameworks
  • Synthetic Data Generation

Возможные вопросы на собеседовании

Проверка практического опыта работы с LLM и понимания их ограничений.

Расскажите о самом сложном случае, когда вам нужно было оценить качество ответов LLM в узкоспециализированной области. Какие метрики вы использовали?

Оценка навыков проектирования сред для обучения с подкреплением.

Как бы вы подошли к созданию функции вознаграждения (reward function) для задачи анализа финансовой отчетности, чтобы избежать 'взлома' системы моделью?

Проверка способности работать с экспертами из других областей.

Опишите ваш опыт перевода сложных бизнес-требований или профессиональных регламентов в программную логику верификации.

Оценка самостоятельности и инициативности (High Agency).

Приведите пример ситуации, когда вы обнаружили проблему в архитектуре или процессе и устранили её без прямого указания руководства.

Проверка владения современным стеком разработки.

Как вы используете LLM в своем ежедневном рабочем процессе для ускорения разработки и повышения качества кода?

Похожие вакансии

Itvolna.tech
400 000 ₽ – 430 000 ₽

MLOps Engineer (Python)

УдалённоРоссия
Python · FastAPI · aiohttp · SQLAlchemy · asyncio · Docker · Kubernetes · Kafka · Redis · PostgreSQL · MLOps · LLM · RAG · AutoML
+14 навыков
JETLYN
310 000 ₽ – 430 000 ₽

AI Engineer (CV & Navigation)

SeniorУдалённоРоссия
Computer Vision · Python · PyTorch · TensorFlow · SLAM · Deep Learning · Augmented Reality
+7 навыков
NDA
Не указана

Middle, Middle+, Senior GenAI/LLM Разработчик

SeniorУдалённоРоссия
n8n · JSON · PostgreSQL · REST · GraphQL · OAuth2 · FastAPI · JavaScript · TypeScript · React · Python · LangChain · RAG · pgvector · Qdrant · Milvus · Prompt Engineering
+17 навыков
QLAN
Не указана

Middle / Senior GenAI Engineer (CV)

SeniorУдалённоРоссия
Computer Vision · Diffusion Models · Stable Diffusion · SDXL · LoRA · UNet · Python · PyTorch · Machine Learning · Image Generation · Video Generation
+11 навыков
Academy of Digital Industries (ADI)
960 $ – 1 680 $

AI Engineer / AI Mentor

УдалённоКазахстан
Python · NumPy · Pandas · PyTorch · TensorFlow · LLM · NLP · Computer Vision · Machine Learning · Data Science
+10 навыков
NDA
90 000 ₽

Junior разработчик agent AI-систем

JuniorУдалённоРоссия
Python · FastAPI · OpenAI · PostgreSQL · Nginx · Ubuntu · RAG · Vector Database · Embeddings · Figma
+10 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

mentis
Страна
Великобритания