Страна: США
Зарплата: 220 000 $ – 260 000 $

+500% приглашений

Откликайтесь
на вакансии с ИИ

УдалённоПолная занятость

Member of Technical Staff — Real-Time Video Generation (Applied ML Engineer)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Исключительная вакансия с очень высокой базовой зарплатой, возможностью удаленной работы и офисами в мировых технологических хабах. Проект находится на острие технологий (Generative Video), что гарантирует профессиональный рост.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена необходимостью глубоких знаний в области генеративного видео, оптимизации инференса и работы с высоконагруженными ML-системами. Роль требует редкого сочетания навыков Research и Engineering.

Анализ зарплаты

Медиана180 000 $

Рынок150 000 $ – 230 000 $

Предлагаемая зарплата ($220K–260K) находится на верхнем уровне рынка для Senior/Staff ML ролей в США и Европе. Это значительно выше среднего медианного значения для ML-инженеров, даже в топовых технологических компаниях.

I am writing to express my strong interest in the Member of Technical Staff — Real-Time Video Generation position at Cantina. With a robust background in Applied ML and a specific focus on generative models, I have extensive experience in taking complex video generation models and optimizing them for production-ready, real-time systems. My expertise in training, fine-tuning, and distillation aligns perfectly with your team's mission to push the boundaries of video generation.

In my previous roles, I have successfully managed multi-GPU training setups and implemented model compression techniques to meet strict latency and memory constraints. I am particularly excited about the opportunity to work at the intersection of ML research and infrastructure at Cantina, leveraging tools like TensorRT and Triton to deliver high-performance inference. I am confident that my technical skills and product-oriented mindset will make a significant contribution to your real-time video generation efforts.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в cantina уже сейчас

Присоединяйтесь к Cantina, чтобы создавать будущее генерации видео в реальном времени — подавайте заявку прямо сейчас!

Описание вакансии

tldr: Cantina, Member of Technical Staff — Real-Time Video Generation, $220K–260K base + bonus, Remote (GMT ±3) 🌍 (не РФ/РБ)

Есть офис в Лондоне, Нью-Йорке, Калифорнии.

Ищем сильного Applied ML Engineer в команду real-time video generation в Cantina.

Это роль на стыке research и engineering: нужно уметь брать большие video generation models и доводить их до production-ready fast / real-time системы. Основной фокус — training / fine-tuning / distillation / optimization, а также ускорение инференса, снижение latency / memory / cost и интеграция моделей в реальные продуктовые сценарии.

Что предстоит делать:

обучать и дообучать video generation models на multi-GPU сетапах;
работать с data pipelines для видео;
заниматься distillation / compression / acceleration моделей;
оптимизировать inference под real-time constraints;
собирать прототипы и доводить их до production;
работать на стыке ML, infra и product.

Что важно:

хороший практический опыт с generative models, особенно image / video;
опыт с training, fine-tuning, distillation, optimization;
понимание inference bottlenecks, latency / memory / throughput trade-offs;
желательно знакомство с Docker, Kubernetes, AWS;
плюс — TensorRT / Triton / ONNX и похожие acceleration toolchains.

Если вам интересно — лучше всего податься Откликнуться

И после этого маякнуть мне в личку: Откликнуться.

Также пишите в личку, если есть вопросы, — с радостью отвечу.

Если знаете сильных ребят — тоже с удовольствием посмотрю рекомендации.

Сразу оговорюсь: полноценный relocation package мы не предоставляем, но помогаем с юристами, оформлением визы.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Machine Learning
Generative Models
Computer Vision
PyTorch
Docker
Kubernetes
AWS
TensorRT
Triton Inference Server
ONNX
Model Distillation
Model Optimization

Возможные вопросы на собеседовании

Проверка опыта работы с конкретными техниками уменьшения моделей для видео.

Какие методы дистилляции или квантования вы использовали для видео-моделей, чтобы сохранить временную связность кадров?

Оценка навыков оптимизации производительности.

Как бы вы подошли к оптимизации задержки (latency) для модели генерации видео, работающей в реальном времени?

Проверка практического опыта работы с инфраструктурой.

Опишите ваш опыт настройки пайплайнов обучения на multi-GPU кластерах: с какими основными узкими местами вы сталкивались?

Оценка понимания архитектурных особенностей.

В чем основные отличия в оптимизации инференса для Image Generation по сравнению с Video Generation?

Проверка умения работать с инструментами ускорения.

Был ли у вас опыт работы с TensorRT или Triton Inference Server для деплоя тяжелых генеративных моделей?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

СШАот 220 000 $

Откликайтесь
на вакансии с ИИ

Member of Technical Staff — Real-Time Video Generation (Applied ML Engineer)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в cantina уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие методы дистилляции или квантования вы использовали для видео-моделей, чтобы сохранить временную связность кадров?

Как бы вы подошли к оптимизации задержки (latency) для модели генерации видео, работающей в реальном времени?

Опишите ваш опыт настройки пайплайнов обучения на multi-GPU кластерах: с какими основными узкими местами вы сталкивались?

В чем основные отличия в оптимизации инференса для Image Generation по сравнению с Video Generation?

Был ли у вас опыт работы с TensorRT или Triton Inference Server для деплоя тяжелых генеративных моделей?

Похожие вакансии

Senior MLOps инженер

Team Lead Data Science / ML

MLOps инженер (Team Lead)

MLOps инженер (Тимлид)

Senior MLOps инженер

Senior Data Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Member of Technical Staff — Real-Time Video Generation (Applied ML Engineer)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в cantina уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Какие методы дистилляции или квантования вы использовали для видео-моделей, чтобы сохранить временную связность кадров?

Как бы вы подошли к оптимизации задержки (latency) для модели генерации видео, работающей в реальном времени?

Опишите ваш опыт настройки пайплайнов обучения на multi-GPU кластерах: с какими основными узкими местами вы сталкивались?

В чем основные отличия в оптимизации инференса для Image Generation по сравнению с Video Generation?

Был ли у вас опыт работы с TensorRT или Triton Inference Server для деплоя тяжелых генеративных моделей?

Похожие вакансии

Senior MLOps инженер

Team Lead Data Science / ML

MLOps инженер (Team Lead)

MLOps инженер (Тимлид)

Senior MLOps инженер

Senior Data Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ