yandex
upwork
Страна
Канада
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorВ офисеПолная занятость

Sr AI Research Scientist, AI Evaluation and Reliability

Оценка ИИ

Высокий балл обусловлен сильным брендом Upwork, работой над передовыми технологиями (агенты, генеративный ИИ) и возможностью влиять на продукт мирового уровня. Позиция предлагает отличный баланс между научными исследованиями и реальным бизнес-применением.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Роль требует исключительного сочетания глубоких научных знаний в области ИИ и практического опыта внедрения моделей в продакшн. Высокий уровень ответственности за надежность систем (Reliability) и необходимость лидерства в кросс-функциональных проектах делают эту позицию крайне сложной.

Анализ зарплаты

Медиана195 000 $
Рынок165 000 $ – 240 000 $
Оценка ИИ

Предлагаемая роль Senior Lead уровня в Торонто соответствует верхнему сегменту рынка. Указанные оценки учитывают высокую конкуренцию за специалистов по AI Reliability в технологическом хабе Канады.

Сопроводительное письмо

I am writing to express my strong interest in the Sr. Lead AI Research Scientist position focused on AI Evaluation and Reliability at Upwork. With extensive experience in applied AI research and a deep focus on model robustness, I am particularly drawn to Upwork's mission of creating opportunity through AI-enabled talent solutions. My background in developing evaluation frameworks for large-scale generative models aligns perfectly with your goal of enhancing the reliability of Uma and other agentic architectures.

In my previous roles, I have successfully led initiatives to mitigate hallucinations and improve uncertainty estimation in production environments. I am proficient in PyTorch and Python, and I thrive in collaborative environments where research directly impacts product outcomes. I am excited about the prospect of contributing to Upwork’s external research footprint while mentoring a talented team of researchers and engineers to build more trustworthy AI systems.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в upwork уже сейчас

Присоединяйтесь к команде Upwork и определяйте будущее надежного ИИ в крупнейшем маркетплейсе талантов!

Описание вакансии

Upwork Inc.’s (Nasdaq: UPWK) family of companies connects businesses with global, AI-enabled talent across every contingent work type including freelance, fractional, and payrolled. This portfolio includes the Upwork Marketplace, which connects businesses with on-demand access to highly skilled talent across the globe, and Lifted, which provides a purpose-built solution for enterprise organizations to source, contract, manage, and pay talent across the full spectrum of contingent work. From Fortune 100 enterprises to entrepreneurs, businesses rely on Upwork Inc. to find and hire expert talent, leverage AI-powered work solutions, and drive business transformation. With access to professionals spanning more than 10,000 skills across AI & machine learning, software development, sales & marketing, customer support, finance & accounting, and more, the Upwork family of companies enables businesses of all sizes to scale, innovate, and transform their workforces for the age of AI and beyond.

Since its founding, Upwork Inc. has facilitated more than $30 billion in total transactions and services as it fulfills its purpose to create opportunity in every era of work. Learn more about the Upwork Marketplace at Upwork.com and follow us on LinkedIn, Facebook, Instagram, TikTok, and X; and learn more about Lifted at Go-Lifted and follow on LinkedIn.


Sr. Lead AI Research Scientist, AI Evaluation and Reliability

The AI Foundations team leads core research and development across the training, evaluation, and deployment of AI systems that power Uma, Upwork’s flagship AI model, and other customer-facing generative AI capabilities. As a Sr. Lead AI Research Scientist focused on AI Evaluation and Reliability, you will drive high-impact research initiatives that improve the trustworthiness, robustness, and real-world performance of AI systems operating at marketplace scale.

At the Sr. Lead level, this role combines deep technical expertise with cross-functional leadership. You will identify and lead research efforts that address systemic reliability challenges, partner closely with engineering and product teams to translate research into production outcomes, and help shape how Upwork evaluates AI performance in real work scenarios. Your work will support AI systems embedded in retrieval-based workflows, agentic architectures, and human plus AI collaboration patterns, while contributing to Upwork’s broader AI research strategy and external presence.

Responsibilities:

  • Lead applied research initiatives focused on AI evaluation, reliability, and robustness, defining success metrics tied to customer impact and production readiness.
  • Design and validate methods to measure and mitigate AI reliability risks, including uncertainty estimation, hallucination detection, and identification of model failure modes.
  • Partner cross-functionally with engineering, data science, and product teams to integrate research outcomes into customer-facing AI systems and workflows.
  • Own research projects end to end, from problem framing and hypothesis development through experimentation, prototyping, and synthesis of results.
  • Influence technical direction across teams by surfacing insights, proposing scalable solutions, and aligning stakeholders on priorities and tradeoffs.
  • Mentor researchers and engineers through technical guidance, feedback, and collaborative leadership on shared initiatives.
  • Contribute to Upwork’s external research footprint through publications, presentations, and engagement with the broader AI research community.

What it takes to catch our eye:

  • Proven experience leading applied AI research that balances scientific rigor with real-world deployment constraints and business impact.
  • A strong record of research contribution through publications, internal innovation, or demonstrable influence on production AI systems.
  • Deep proficiency with Python and modern deep learning frameworks such as PyTorch, with hands-on experience evaluating and improving large-scale models.
  • An adaptive approach to integrating AI tools into research and development workflows to accelerate experimentation, improve evaluation quality, and share best practices with others.
  • A collaborative, growth-oriented mindset with the ability to mentor peers, communicate complex ideas clearly, and thrive in a fast-evolving, bottom-up environment.

This position will initially be employed through a partner to ensure a seamless hiring process while we establish the hub. Once the hub is established, there may be opportunities to transition to employment with Upwork depending on business needs and other requirements. While employed by the partner, you’ll work as part of Upwork’s team, with access to our resources, culture, and growth opportunities.

To learn more about how Upwork processes and protects your personal information as part of the application process, please review our Global Job Applicant Privacy Notice

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • PyTorch
  • Deep Learning
  • Generative AI
  • Machine Learning
  • AI Evaluation
  • Large Language Models
  • Research

Возможные вопросы на собеседовании

Позиция сфокусирована на надежности ИИ. Важно понять, как кандидат справляется с основной проблемой современных LLM.

Какие методы обнаружения и минимизации галлюцинаций в больших языковых моделях вы считаете наиболее эффективными для систем масштаба Upwork?

Роль предполагает работу с агентными архитектурами. Проверка понимания специфики оценки таких систем.

Как бы вы подошли к разработке метрик оценки для автономных ИИ-агентов, выполняющих многошаговые задачи в маркетплейсе?

Вакансия требует опыта работы с PyTorch и глубокого обучения. Проверка технической экспертизы.

Опишите ваш опыт оптимизации процессов оценки моделей (evaluation pipelines) для ускорения циклов экспериментов без потери точности.

Это позиция уровня Sr. Lead, требующая влияния на техническое направление компании.

Приведите пример, когда результаты вашего исследования заставили команду изменить продуктовую стратегию или технический подход. Как вы аргументировали свою позицию?

Upwork ценит вклад в научное сообщество.

Какие последние публикации в области AI Reliability или Uncertainty Estimation вы считаете наиболее значимыми и почему?

Похожие вакансии

JETLYN
310 000 ₽ – 430 000 ₽

AI Engineer (CV & Navigation)

SeniorУдалённоРоссия
Computer Vision · Python · PyTorch · TensorFlow · SLAM · Deep Learning · Augmented Reality
+7 навыков
NDA
Не указана

Middle, Middle+, Senior GenAI/LLM Разработчик

SeniorУдалённоРоссия
n8n · JSON · PostgreSQL · REST · GraphQL · OAuth2 · FastAPI · JavaScript · TypeScript · React · Python · LangChain · RAG · pgvector · Qdrant · Milvus · Prompt Engineering
+17 навыков
QLAN
Не указана

Middle / Senior GenAI Engineer (CV)

SeniorУдалённоРоссия
Computer Vision · Diffusion Models · Stable Diffusion · SDXL · LoRA · UNet · Python · PyTorch · Machine Learning · Image Generation · Video Generation
+11 навыков
Золотое Яблоко
Не указана

Senior / Lead LLM Engineer

SeniorУдалённоРоссия
Python · LLM · Generative AI · RAG · Vector Databases · Machine Learning · Information Retrieval · NLP
+8 навыков
Aiuta
6 000 € – 8 000 €

Senior Computer Vision Engineer

SeniorУдалённоКипр
Python · PyTorch · Computer Vision · Diffusion Models · Generative Adversarial Networks · Machine Learning
+6 навыков
NDA
Не указана

AI Platform Engineer (RAG/Agents/Skills)

SeniorУдалённоАрмения
Python · SQL · FastAPI · LangGraph · LlamaIndex · Haystack · Semantic Kernel · Qdrant · pgvector · Weaviate · Milvus · OpenSearch · ElasticSearch · Airflow · Prefect · Dagster · Temporal · Langfuse · OpenTelemetry · Docker · Kubernetes · CI/CD · RAG · LLM
+24 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

upwork
Страна
Канада