Страна: Великобритания

+500% приглашений

Откликайтесь
на вакансии с ИИ

В офисеПолная занятость

Member of Technical Staff (Applied AI)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Уникальная возможность работать над фундаментальными проблемами надежности ИИ в Лондоне. Высокая степень автономности, работа с передовыми моделями и прямое влияние на продукт делают эту вакансию крайне привлекательной для амбициозных инженеров.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует не только глубоких технических знаний в области LLM и RL, но и способности работать на стыке инженерии и предметных областей (финансы, медицина). Высокий уровень ответственности и отсутствие четких спецификаций делают позицию сложной для кандидатов без опыта в стартапах.

Анализ зарплаты

Медиана90 000 £

Рынок70 000 £ – 115 000 £

Для позиции Member of Technical Staff в AI-стартапе Лондона рыночный диапазон составляет £70,000–£110,000 в год. Учитывая специфику Applied AI и работу в офисе, компенсация может включать значительный опционный пакет.

I am writing to express my strong interest in the Member of Technical Staff (Applied AI) position at Mentis. With a solid background in building agentic harnesses and a practical approach to LLM evaluation, I am drawn to your mission of making AI reliable in high-stakes domains like finance and healthcare. I thrive in high-agency environments where ownership is the default, and I am eager to apply my engineering skills to bridge the gap between complex professional workflows and verifiable task environments.

In my previous projects, I have focused on creating robust evaluation pipelines and moving beyond simple notebooks to production-ready systems. I am particularly excited about the opportunity to collaborate with domain experts to design reward functions and verification logic that define the ground truth for frontier models. My bias toward action and experience in iterating quickly align perfectly with the fast-paced, lean team structure at Mentis.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в mentis уже сейчас

Присоединяйтесь к команде в Лондоне и создавайте среду обучения для ИИ нового поколения в самых ответственных отраслях!

Описание вакансии

About Aptura

We build the evaluation datasets and RL environments that make AI reliable in domains where mistakes are expensive: finance, healthcare, and legal. Our team designs expert-curated training data, calibrated rubrics, and verifiable task environments for AI labs and startups pushing the frontier of what models can do in regulated industries.

We're a small, lean, London based team that moves fast and takes the work seriously. Everyone contributes directly. Initiative is rewarded, and ownership is the default. If you want to shape how frontier AI learns to operate in the real world, we'd like to hear from you.

About the Role

As a Member of Technical Staff on our Applied AI team, you will build the tasks and environments that AI labs use to train and evaluate their agents in finance, healthcare, and legal.

Day to day, that looks like: constructing RL environments around spreadsheets, documents, and professional workflows. Writing verification logic and reward functions. Working with domain experts to scope what a correct answer actually looks like in an LBO model or a clinical note. Some days it's engineering, some days it's closer to research. The common thread is that you're producing the ground truth that frontier models get measured against.

What You'll Do

Build RL environments across finance, healthcare, and legal domains
Assist in designing tasks with golden answers, calibrated rubrics, and programmatic reward signals
Write verification logic and reward functions that can distinguish good model outputs from bad ones
Work directly with domain experts (investment analysts, physicians, attorneys) to translate complex professional workflows into structured tasks
Prototype new approaches to evaluation, verification, and synthetic data generation

Who We're Looking For

Practical experience building with LLMs: prompting, evaluation, and agentic harnesses. You've built things that actually run, not just notebooks.
High agency and technically sharp. You don't wait for permission, specs, or a roadmap. You see what needs doing, figure out how, and get it done.
Comfortable working across very different contexts. The job moves between engineering, evaluation design, and deep collaboration with domain experts often in the same day.
You ship and iterate. Small team, no room for work that sits in review. Bias toward getting something working, learning from it, and improving it.
You own problems end to end, from scoping with a domain expert through to a working environment. If you prefer clearly partitioned tickets, this probably isn't the right fit.
Already using LLMs as part of how you build, not just as the thing you're building for.

Nice to Have

Domain knowledge in finance, healthcare, or legal
Familiarity with RL concepts, model training, and post-training workflows
Cloud infrastructure experience (AWS or GCP)
Previous startup experience, especially as an early engineer

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

LLM
Reinforcement Learning
Python
Prompt Engineering
AWS
Google Cloud Platform
Synthetic Data Generation
Evaluation Frameworks

Возможные вопросы на собеседовании

Проверка практического опыта работы с LLM и понимания их ограничений.

Расскажите о самом сложном случае, когда вам нужно было оценить качество ответов LLM в узкоспециализированной области. Какие метрики вы использовали?

Оценка навыков проектирования сред для обучения с подкреплением.

Как бы вы подошли к созданию функции вознаграждения (reward function) для задачи анализа финансовой отчетности, чтобы избежать 'взлома' системы моделью?

Проверка способности работать с экспертами из других областей.

Опишите ваш опыт перевода сложных бизнес-требований или профессиональных регламентов в программную логику верификации.

Оценка самостоятельности и инициативности (High Agency).

Приведите пример ситуации, когда вы обнаружили проблему в архитектуре или процессе и устранили её без прямого указания руководства.

Проверка владения современным стеком разработки.

Как вы используете LLM в своем ежедневном рабочем процессе для ускорения разработки и повышения качества кода?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Великобритания

Откликайтесь
на вакансии с ИИ

Member of Technical Staff (Applied AI)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в mentis уже сейчас

Описание вакансии

About Aptura

About the Role

What You'll Do

Who We're Looking For

Nice to Have

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о самом сложном случае, когда вам нужно было оценить качество ответов LLM в узкоспециализированной области. Какие метрики вы использовали?

Как бы вы подошли к созданию функции вознаграждения (reward function) для задачи анализа финансовой отчетности, чтобы избежать 'взлома' системы моделью?

Опишите ваш опыт перевода сложных бизнес-требований или профессиональных регламентов в программную логику верификации.

Приведите пример ситуации, когда вы обнаружили проблему в архитектуре или процессе и устранили её без прямого указания руководства.

Как вы используете LLM в своем ежедневном рабочем процессе для ускорения разработки и повышения качества кода?

Похожие вакансии

T-shape Аналитик AI (Middle / Senior)

Архитектор мультиагентных систем на базе LLM

Fullstack разработчик-подмастерье (AI Engineer)

Специалист по AI-инструментам

Fullstack / AI разработчик (подмастерье)

AI engineer (ML/DS)

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Member of Technical Staff (Applied AI)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в mentis уже сейчас

Описание вакансии

About Aptura

About the Role

What You'll Do

Who We're Looking For

Nice to Have

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о самом сложном случае, когда вам нужно было оценить качество ответов LLM в узкоспециализированной области. Какие метрики вы использовали?

Как бы вы подошли к созданию функции вознаграждения (reward function) для задачи анализа финансовой отчетности, чтобы избежать 'взлома' системы моделью?

Опишите ваш опыт перевода сложных бизнес-требований или профессиональных регламентов в программную логику верификации.

Приведите пример ситуации, когда вы обнаружили проблему в архитектуре или процессе и устранили её без прямого указания руководства.

Как вы используете LLM в своем ежедневном рабочем процессе для ускорения разработки и повышения качества кода?

Похожие вакансии

T-shape Аналитик AI (Middle / Senior)

Архитектор мультиагентных систем на базе LLM

Fullstack разработчик-подмастерье (AI Engineer)

Специалист по AI-инструментам

Fullstack / AI разработчик (подмастерье)

AI engineer (ML/DS)

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ