- Страна
- США
- Зарплата
- 220 000 $ – 260 000 $
Откликайтесь
на вакансии с ИИ

Member of Technical Staff — Real-Time Video Generation (Applied ML Engineer)
Исключительная вакансия с очень высокой базовой зарплатой, возможностью удаленной работы и офисами в мировых технологических хабах. Проект находится на острие технологий (Generative Video), что гарантирует профессиональный рост.
Сложность вакансии
Высокая сложность обусловлена необходимостью глубоких знаний в области генеративного видео, оптимизации инференса и работы с высоконагруженными ML-системами. Роль требует редкого сочетания навыков Research и Engineering.
Анализ зарплаты
Предлагаемая зарплата ($220K–260K) находится на верхнем уровне рынка для Senior/Staff ML ролей в США и Европе. Это значительно выше среднего медианного значения для ML-инженеров, даже в топовых технологических компаниях.
Сопроводительное письмо
I am writing to express my strong interest in the Member of Technical Staff — Real-Time Video Generation position at Cantina. With a robust background in Applied ML and a specific focus on generative models, I have extensive experience in taking complex video generation models and optimizing them for production-ready, real-time systems. My expertise in training, fine-tuning, and distillation aligns perfectly with your team's mission to push the boundaries of video generation.
In my previous roles, I have successfully managed multi-GPU training setups and implemented model compression techniques to meet strict latency and memory constraints. I am particularly excited about the opportunity to work at the intersection of ML research and infrastructure at Cantina, leveraging tools like TensorRT and Triton to deliver high-performance inference. I am confident that my technical skills and product-oriented mindset will make a significant contribution to your real-time video generation efforts.
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в cantina уже сейчас
Присоединяйтесь к Cantina, чтобы создавать будущее генерации видео в реальном времени — подавайте заявку прямо сейчас!
Описание вакансии
tldr: Cantina, Member of Technical Staff — Real-Time Video Generation, $220K–260K base + bonus, Remote (GMT ±3) 🌍 (не РФ/РБ)
Есть офис в Лондоне, Нью-Йорке, Калифорнии.
Ищем сильного Applied ML Engineer в команду real-time video generation в Cantina.
Это роль на стыке research и engineering: нужно уметь брать большие video generation models и доводить их до production-ready fast / real-time системы. Основной фокус — training / fine-tuning / distillation / optimization, а также ускорение инференса, снижение latency / memory / cost и интеграция моделей в реальные продуктовые сценарии.
Что предстоит делать:
- обучать и дообучать video generation models на multi-GPU сетапах;
- работать с data pipelines для видео;
- заниматься distillation / compression / acceleration моделей;
- оптимизировать inference под real-time constraints;
- собирать прототипы и доводить их до production;
- работать на стыке ML, infra и product.
Что важно:
- хороший практический опыт с generative models, особенно image / video;
- опыт с training, fine-tuning, distillation, optimization;
- понимание inference bottlenecks, latency / memory / throughput trade-offs;
- желательно знакомство с Docker, Kubernetes, AWS;
- плюс — TensorRT / Triton / ONNX и похожие acceleration toolchains.
Если вам интересно — лучше всего податься Откликнуться
И после этого маякнуть мне в личку: Откликнуться.
Также пишите в личку, если есть вопросы, — с радостью отвечу.
Если знаете сильных ребят — тоже с удовольствием посмотрю рекомендации.
Сразу оговорюсь: полноценный relocation package мы не предоставляем, но помогаем с юристами, оформлением визы.
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- AWS
- PyTorch
- Machine Learning
- Kubernetes
- Computer Vision
- Docker
- TensorRT
- Model Distillation
- Triton Inference Server
- ONNX
- Model Optimization
- Generative Models
Возможные вопросы на собеседовании
Проверка опыта работы с конкретными техниками уменьшения моделей для видео.
Какие методы дистилляции или квантования вы использовали для видео-моделей, чтобы сохранить временную связность кадров?
Оценка навыков оптимизации производительности.
Как бы вы подошли к оптимизации задержки (latency) для модели генерации видео, работающей в реальном времени?
Проверка практического опыта работы с инфраструктурой.
Опишите ваш опыт настройки пайплайнов обучения на multi-GPU кластерах: с какими основными узкими местами вы сталкивались?
Оценка понимания архитектурных особенностей.
В чем основные отличия в оптимизации инференса для Image Generation по сравнению с Video Generation?
Проверка умения работать с инструментами ускорения.
Был ли у вас опыт работы с TensorRT или Triton Inference Server для деплоя тяжелых генеративных моделей?
Похожие вакансии
Middle+ ML разработчик
Senior MLOps Engineer (Platform Development / LLMOps)
Data Scientist Senior (Part-time)
Senior Data инженер
Senior MLOps
Data Engineer / SAP HANA Developer (Senior)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- США
- Зарплата
- 220 000 $ – 260 000 $