yandex
tenstorrent
Страна
Польша
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
ГибридПолная занятость

Software Engineer, Kernel Development and Optimization

Оценка ИИ

Исключительная возможность работать в одной из самых инновационных компаний в сфере ИИ-железа под руководством легенд индустрии. Высокий балл за работу с передовыми технологиями (RISC-V, AI accelerators) и конкурентную компенсацию, несмотря на строгие требования экспортного контроля США.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Высокая сложность обусловлена необходимостью глубоких знаний архитектуры процессоров, низкоуровневой оптимизации на C++ и понимания специфики ИИ-ускорителей. Работа требует навыков отладки сложных системных проблем и владения методами профилирования производительности.

Анализ зарплаты

Медиана85 000 $
Рынок65 000 $ – 110 000 $
Оценка ИИ

Предлагаемая позиция в Tenstorrent обычно предполагает зарплату выше среднего по рынку Польши для системных инженеров, часто включая опционы или акции компании. Указанный рыночный диапазон отражает стандартные уровни для Senior/Lead специалистов в международных продуктовых компаниях в Варшаве и Гданьске.

Сопроводительное письмо

I am writing to express my strong interest in the Software Engineer position for Kernel Development and Optimization at Tenstorrent. With a deep background in C++ systems engineering and a passion for low-level performance tuning, I have consistently focused on squeezing every bit of efficiency out of hardware architectures. My experience in reasoning about concurrency, memory trade-offs, and latency hiding aligns perfectly with Tenstorrent's mission to redefine AI compute.

In my previous roles, I have successfully optimized performance-critical kernels and utilized data-driven profiling to guide architectural decisions. I am particularly excited about the opportunity to work with Tenstorrent's custom RISC-V based hardware and contribute to the development of GPU-style kernels like matrix multiplication and attention primitives. I thrive in collaborative environments where hardware and software co-evolve, and I am eager to bring my debugging and micro-benchmarking expertise to your talented team in Poland.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в tenstorrent уже сейчас

Присоединяйтесь к команде Tenstorrent, чтобы создавать будущее ИИ-вычислений на базе архитектуры RISC-V!

Описание вакансии

Tenstorrent is leading the industry on cutting-edge AI technology, revolutionizing performance expectations, ease of use, and cost efficiency. With AI redefining the computing paradigm, solutions must evolve to unify innovations in software models, compilers, platforms, networking, and semiconductors. Our diverse team of technologists have developed a high performance RISC-V CPU from scratch, and share a passion for AI and a deep desire to build the best AI platform possible. We value collaboration, curiosity, and a commitment to solving hard problems. We are growing our team and looking for contributors of all seniorities.

Tenstorrent is building next-generation AI compute. The Kernel Development and Optimization team develops the performance-critical kernels that unlock the full capability of our hardware across ML and HPC workloads.

This role ishybrid based out of Warsaw or Gdansk, Poland.

We welcome candidates at various experience levels for this role. During the interview process, candidates will be assessed for the appropriate level, and offers will align with that level, which may differ from the one in this posting.

Who You Are

  • A strong C++ systems engineer with experience writing performance-critical or low-level software.
  • Comfortable reasoning about concurrency, synchronization, latency hiding, and compute versus memory trade-offs.
  • Data-driven in your approach, using profiling and benchmarking results to guide optimization decisions.
  • Effective at debugging complex runtime or kernel-level issues in large codebases.
  • Structured thinker who can break down ambiguous performance problems into measurable experiments.

What We Need

  • Engineers who can design, implement, and optimize GPU-style kernels such as matrix multiplication, attention primitives, and data-movement operations.
  • Clear ownership of performance, from identifying bottlenecks to delivering measurable throughput improvements.
  • Contribution to host-side orchestration code and parallelization strategies.
  • Development of micro-benchmarks, regression tests, and tooling to ensure correctness and sustained performance gains.
  • Close collaboration with compiler, runtime, ML, and hardware teams to integrate kernels into production systems.

What You Will Learn

  • The execution model, memory architecture, and performance characteristics of Tenstorrent AI hardware.
  • How to write and optimize accelerator kernels outside traditional CUDA-first ecosystems.
  • Practical AI-assisted and agentic workflows for kernel generation, debugging, and optimization.
  • How to translate performance intuition into rigorous, reproducible engineering results.
  • How low-level kernels, compilers, runtime systems, and hardware co-evolve in modern AI platforms.

Tenstorrent offers a highly competitive compensation package and benefits, and we are an equal opportunity employer.

This offer of employment is contingent upon the applicant being eligible to access U.S. export-controlled technology.  Due to U.S. export laws, including those codified in the U.S. Export Administration Regulations (EAR), the Company is required to ensure compliance with these laws when transferring technology to nationals of certain countries (such as EAR Country Groups D:1, E1, and E2).   These requirements apply to persons located in the U.S. and all countries outside the U.S.  As the position offered will have direct and/or indirect access to information, systems, or technologies subject to these laws, the offer may be contingent upon your citizenship/permanent residency status or ability to obtain prior license approval from the U.S. Commerce Department or applicable federal agency.  If employment is not possible due to U.S. export laws, any offer of employment will be rescinded.

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • C++
  • Benchmarking
  • Performance Optimization
  • Profiling
  • Systems Programming
  • Concurrency Control
  • Kernel development
  • RISC-V
  • Low-level programming
  • GPU Kernels
  • Matrix Multiplication

Возможные вопросы на собеседовании

Проверка понимания работы с памятью, что критично для разработки ядер (kernels).

Как бы вы оптимизировали использование кэш-памяти при реализации операции умножения матриц для специализированного ускорителя?

Важно для оценки навыков работы с параллельными вычислениями.

Опишите ваш опыт работы с примитивами синхронизации и способы минимизации задержек (latency hiding) в многопоточной среде.

Проверка практических навыков оптимизации.

Какие инструменты профилирования вы используете для поиска узких мест в производительности и как интерпретируете результаты?

Оценка способности работать с нестандартным оборудованием.

В чем заключаются основные сложности при написании кода для RISC-V или кастомных ИИ-ускорителей по сравнению с традиционными x86/x64 системами?

Проверка системного мышления.

Расскажите о самом сложном баге на уровне ядра или системного ПО, который вы нашли. Как вы его локализовали и устранили?

Похожие вакансии

JETLYN
350 000 ₽ – 450 000 ₽

C++ Developer (System Programming / COM & RPC)

SeniorУдалённоРоссия
C++ · COM · DCOM · RPC · POSIX · Linux · Socket Programming · Multithreading · Wireshark · WINE
+10 навыков
TopSelection
300 000 ₽ – 370 000 ₽

Senior C Developer (Linux Kernel)

SeniorУдалённоРоссия
C++ · Linux Kernel · VFS · POSIX · IPC · mmap · seccomp · ptrace · perf · strace · GDB · inotify · epoll
+13 навыков
NDA
Не указана

Инженер сетевой (Senior)

SeniorУдалённоРоссия
Linux · BGP · OSPF · VXLAN · VPN · VRRP · LACP · Python · Bash · Docker · SDN · Open vSwitch · Wireshark · TCPDump · IXIA · Spirent · TRex · EVE-NG · GNS3
+19 навыков
ЛАНИТ
Не указана

C++ разработчик (ethernet-коммутатор)

SeniorУдалённоРоссия
C++ · Linux · TCP/IP · Docker · Git · BGP · ARP · BFD · ECMP · LACP · RSTP · STP · VLAN · VRRP · VXLAN · Wireshark · TCPDump · Iperf · Cisco TRex · EVE-NG · GNS3
+21 навыков
X5 Tech
Не указана

Стажер в группу поддержки сетевой инфраструктуры

InternУдалённоРоссия
Cisco · HP · Huawei · Juniper · MikroTik · Eltex · TCP/IP · ARP · BGP · Zabbix · Netbox · Wireshark · DHCP · Static Routing · LLDP · CDP · EtherChannel · Spanning Tree Protocol · GRE · DMVPN
+20 навыков
PN Labs (based on handle)
4 000 $ – 6 000 $

C++ Developer (Desktop VPN Client)

SeniorУдалённо
C++ · Qt · QML · gRPC · CMake · vcpkg · Boost · OpenSSL · cURL · RxCpp · WireGuard · TCP/IP · DNS · TLS · Win32 · WFP
+16 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

tenstorrent
Страна
Польша