Страна: Канада

+500% приглашений

Откликайтесь
на вакансии с ИИ

В офисеПолная занятость

Spécialiste CHP

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

DRW — престижная компания с отличной репутацией работодателя. Вакансия предлагает работу с передовыми технологиями (LLM, GPU-кластеры) и конкурентный социальный пакет в одном из ведущих финансовых хабов.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена необходимостью глубоких знаний на стыке системного администрирования Linux, сетевых протоколов и специфического стека для ИИ (GPU, vLLM, Kubernetes). Требуется опыт работы с высоконагруженными распределенными системами.

Анализ зарплаты

Медиана135 000 $

Рынок110 000 $ – 170 000 $

Зарплата в объявлении не указана, но для позиции специалиста по HPC/GPU инфраструктуре в Монреале с опытом более 5 лет рыночные показатели весьма высоки. Ожидаемый доход значительно выше среднего по ИТ-сектору из-за узкой специализации в области ИИ.

I am writing to express my strong interest in the HPC Specialist position at DRW. With over five years of experience in infrastructure engineering and a deep focus on GPU-accelerated workloads, I am excited by the opportunity to optimize large-scale LLM inference clusters within your AI and Multi-Asset Systematic Strategies team. My background in managing Kubernetes clusters with GPU support and my proficiency with model serving frameworks like vLLM align perfectly with the technical challenges described in the posting.

Throughout my career, I have specialized in bridging the gap between bare-metal hardware and high-level model deployment. I have a proven track record of diagnosing performance bottlenecks across the entire stack—from drivers and networking to application layers. I am particularly impressed by DRW's commitment to innovation and its reputation as a top employer in Canada, and I am eager to bring my expertise in Ansible, Terraform, and Python automation to help scale your AI infrastructure.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в drwfr уже сейчас

Присоединяйтесь к команде DRW в Монреале и создавайте будущее ИИ-инфраструктуры на передовом крае технологий!

Описание вакансии

DRW est une société de négoce diversifiée avec plus de 3 décennies d'expérience qui réunit une technologie sophistiquée et des personnes exceptionnelles pour opérer sur les marchés du monde entier. Nous valorisons l'autonomie et la capacité à pivoter rapidement pour saisir les opportunités, c'est pourquoi nous opérons en utilisant notre propre capital et en négociant à nos propres risques.

Basée à Chicago et disposant de bureaux aux États-Unis, au Canada, en Europe et en Asie, nous négocions diverses catégories d'actifs, notamment les titres à revenu fixe, les FNB, les actions, les devises, les matières premières et l'énergie sur les principaux marchés mondiaux. Nous avons également tiré parti de notre expertise et de notre technologie pour nous développer dans trois stratégies non traditionnelles : l'immobilier, le capital-risque et les crypto-actifs.

Nous opérons avec respect, curiosité et ouverture d'esprit. Les personnes qui s'épanouissent ici partagent notre conviction que ce n'est pas seulement ce que nous faisons qui compte - c'est la façon dont nous le faisons. DRW est un lieu d'attentes élevées, d'intégrité, d'innovation et de volonté de remettre en question le consensus.

Nous recherchons un spécialiste CHP pour rejoindre notre équipe IA et stratégies systématiques multi-actifs. Cette équipe conçoit et exploite une infrastructure GPU qui alimente des charges de travail en IA et en apprentissage automatique. Vous travaillerez sur l’ensemble de la pile d’infrastructure, du matériel bare metal jusqu’au déploiement de modèles, en combinant ingénierie des systèmes, optimisation des performances et automatisation de l’infrastructure afin de résoudre des problèmes complexes à l’intersection du matériel, des réseaux et des systèmes distribués.

Responsabilités :

Déployer, maintenir et optimiser l’infrastructure GPU pour des charges de travail d’inférence LLM à grande échelle, incluant le provisionnement, la configuration et le déploiement de flottes de serveurs GPU.
Concevoir et mettre en œuvre des solutions de serving distribuées pour des déploiements de modèles multi-nœuds et multi-GPU.
Gérer des clusters Kubernetes avec support GPU pour des charges de travail LLM et ML.
Configurer l’infrastructure réseau, incluant les load balancers, pare-feu et la communication inter-nœuds pour les clusters GPU.
Mettre en œuvre et optimiser des solutions de stockage pour les poids des modèles et les caches d’inférence.
Diagnostiquer les goulets d’étranglement en matière de performance à tous les niveaux : matériel, pilotes, réseau et couche applicative. Rechercher et évaluer les nouvelles technologies GPU, les frameworks de serving de modèles et les optimisations d’infrastructure.
Collaborer avec les ingénieurs ML pour profiler les performances des modèles et mettre en œuvre des techniques d’accélération de l’inférence. Améliorer la fiabilité via la supervision, les alertes, la planification de capacité et la gestion des incidents.

Exigences :

Licence ou maîtrise en informatique, ingénierie des systèmes ou domaine connexe.
Plus de 5 ans d’expérience en DevOps, SRE ou ingénierie d’infrastructure.
Solide expérience avec l’infrastructure GPU, les frameworks de serving de modèles (vLLM, SGLang) et la gestion des pilotes GPU.
Expérience pratique dans l’optimisation de charges de travail en "deep learning" (inférence ou entraînement) sur des clusters GPU.
Connaissance approfondie des systèmes Linux, incluant la configuration réseau, l’optimisation du stockage et l’orchestration Kubernetes.
Expérience avec des outils d’infrastructure as code (Ansible, Terraform ou équivalent). Bonne compréhension des systèmes distribués, des protocoles réseau (TCP/IP, HTTP/2) et du load balancing.
Maîtrise de Python et des scripts Bash pour l’automatisation.
Expérience avec des outils de monitoring et d’observabilité (Prometheus, Grafana ou équivalent).
Si tu veux, je peux aussi adapter la traduction pour qu’elle soit plus simple ou plus naturelle pour une offre au Québec (ex : termes locaux, ton plus marketing, etc.).

Ce que DRW Montréal a à vous offrir:

Reconnue comme l'un des meilleurs employeurs au Canada depuis 8 ans
Engagement en faveur de la formation et du développement continus
Un ensemble d'avantages et de bénéfices à la pointe de l'industrie
Centré sur le bien-être des employés et l'équilibre entre vie professionnelle et vie privée
Initiatives communautaires, programme de volontariat et possibilités de redonner

Découvrez tous nos avantages à: https://drw.com/fr/work-at-drw/avantages-montreal

Pour plus d'informations sur les activités de traitement de DRW et sur l'utilisation que nous faisons des données des postulants, veuillez lire notre Politique de confidentialité ici https://drw.com/fr/politique-de-confidentialite/.

Résidents de la Californie, veuillez consulter l’avis de confidentialité de la Californie pour obtenir des informations sur certains droits légaux ici https://drw.com/fr/politique-de-confidentialite-californie.

\* Le masculin est utilisé sans discrimination dans le seul but d’alléger le texte.

[#LI-KS1]

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

GPU
Kubernetes
Linux
Python
Ansible
Terraform
vLLM
SGLang
Prometheus
Grafana
Bash
TCP/IP
HTTP/2
Deep Learning

Возможные вопросы на собеседовании

Проверка практического опыта работы с инструментами оптимизации вывода моделей.

Можете ли вы сравнить vLLM и SGLang с точки зрения эффективности использования памяти и пропускной способности при развертывании LLM?

Оценка навыков диагностики сложных системных проблем.

Как бы вы подошли к отладке проблемы, когда задержка (latency) вывода модели резко возрастает в многоузловом GPU-кластере?

Проверка знаний в области оркестрации контейнеров для специфических задач.

С какими основными трудностями вы сталкивались при настройке GPU-операторов в Kubernetes для обеспечения совместного использования ресурсов?

Оценка понимания сетевой инфраструктуры для распределенных вычислений.

Какую роль играет RDMA или InfiniBand в оптимизации связи между узлами при работе с крупными моделями, и как их правильно настроить?

Проверка навыков автоматизации и управления инфраструктурой.

Опишите ваш подход к управлению версиями драйверов NVIDIA и CUDA в большом парке серверов с использованием Infrastructure as Code.

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Канада

Откликайтесь
на вакансии с ИИ

Spécialiste CHP

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в drwfr уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Можете ли вы сравнить vLLM и SGLang с точки зрения эффективности использования памяти и пропускной способности при развертывании LLM?

Как бы вы подошли к отладке проблемы, когда задержка (latency) вывода модели резко возрастает в многоузловом GPU-кластере?

С какими основными трудностями вы сталкивались при настройке GPU-операторов в Kubernetes для обеспечения совместного использования ресурсов?

Какую роль играет RDMA или InfiniBand в оптимизации связи между узлами при работе с крупными моделями, и как их правильно настроить?

Опишите ваш подход к управлению версиями драйверов NVIDIA и CUDA в большом парке серверов с использованием Infrastructure as Code.

Похожие вакансии

T-shape Аналитик AI (Middle / Senior)

Архитектор мультиагентных систем на базе LLM

Fullstack разработчик-подмастерье (AI Engineer)

Специалист по AI-инструментам

Fullstack / AI разработчик (подмастерье)

AI engineer (ML/DS)

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Spécialiste CHP

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в drwfr уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Можете ли вы сравнить vLLM и SGLang с точки зрения эффективности использования памяти и пропускной способности при развертывании LLM?

Как бы вы подошли к отладке проблемы, когда задержка (latency) вывода модели резко возрастает в многоузловом GPU-кластере?

С какими основными трудностями вы сталкивались при настройке GPU-операторов в Kubernetes для обеспечения совместного использования ресурсов?

Какую роль играет RDMA или InfiniBand в оптимизации связи между узлами при работе с крупными моделями, и как их правильно настроить?

Опишите ваш подход к управлению версиями драйверов NVIDIA и CUDA в большом парке серверов с использованием Infrastructure as Code.

Похожие вакансии

T-shape Аналитик AI (Middle / Senior)

Архитектор мультиагентных систем на базе LLM

Fullstack разработчик-подмастерье (AI Engineer)

Специалист по AI-инструментам

Fullstack / AI разработчик (подмастерье)

AI engineer (ML/DS)

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ