yandex
nebius
Страна
Израиль
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
УдалённоПолная занятость

Software Engineer - Scraping Specialist

Оценка ИИ

Nebius — это быстрорастущий единорог с листингом на Nasdaq, работающий на острие технологий ИИ. Вакансия предлагает работу над уникальным продуктом (Tavily), сильную инженерную команду и возможность напрямую влиять на развитие инфраструктуры для ИИ-агентов.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Высокая сложность обусловлена необходимостью глубоких знаний внутренних механизмов браузеров (CDP), методов обхода систем защиты от ботов и опыта построения высоконагруженных распределенных систем. Роль требует сочетания навыков системного программирования и исследовательской работы в быстро меняющейся среде.

Анализ зарплаты

Медиана110 000 $
Рынок90 000 $ – 140 000 $
Оценка ИИ

Зарплата в объявлении не указана, но для инженера такого уровня в Израиле рыночный диапазон составляет от 35,000 до 50,000 ILS в месяц. Nebius обычно предлагает конкурентоспособные условия, соответствующие верхним границам рынка для опытных специалистов.

Сопроводительное письмо

I am writing to express my strong interest in the Software Engineer - Scraping Specialist position at Nebius. With over 4 years of experience in backend development and a deep focus on web scraping and browser automation, I have built resilient data acquisition pipelines that handle complex anti-bot systems and large-scale data extraction. My expertise with Playwright, Puppeteer, and the Chrome DevTools Protocol aligns perfectly with Tavily's mission to provide real-time web access for AI agents.

In my previous roles, I have successfully navigated sophisticated JavaScript-based protections and optimized network flows to ensure high-quality data retrieval. I am particularly excited about the opportunity to work at the intersection of web automation and LLM-powered agents, as I believe that structured access to the live web is the most critical bottleneck for the next generation of AI. I am confident that my technical rigor and experience with distributed systems will allow me to contribute immediately to the Tavily team's ambitious goals.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в nebius уже сейчас

Присоединяйтесь к Nebius и создавайте поисковую систему будущего для ИИ-агентов уже сегодня!

Описание вакансии

Why work at NebiusNebius is leading a new era in cloud computing to serve the global AI economy. We create the tools and resources our customers need to solve real-world challenges and transform industries, without massive infrastructure costs or the need to build large in-house AI/ML teams. Our employees work at the cutting edge of AI cloud infrastructure alongside some of the most experienced and innovative leaders and engineers in the field.

Where we workHeadquartered in Amsterdam and listed on Nasdaq, Nebius has a global footprint with R&D hubs across Europe, North America, and Israel. The team of over 1400 employees includes more than 400 highly skilled engineers with deep expertise across hardware and software engineering, as well as an in-house AI R&D team.

The Role

Tavily team is building the search engine for AI agents. We believe the future of work will be led by AI agents, and that requires restructuring how the web is accessed. Our Search API provides web access for AI agents, enabling real-time internet search optimized for LLMs and Retrieval-Augmented Generation (RAG). We are backed by leading investors and serve developers and enterprises worldwide. Our team is fast-moving and ambitious. We ship quickly, iterate constantly, and care deeply about impact.

As a Software Engineer - Scraping Specialist, you’ll build the systems that power how AI interacts with the live web. You’ll design and implement large-scale, intelligent web acquisition pipelines, making sense of an ever-changing online ecosystem and transforming it into structured, high-quality data.

This role blends technical understanding of browsers, networks, and automation with hands-on engineering. You’ll work on adaptive systems that navigate modern websites, understand evolving web interaction ,detection systems, and gather meaningful information safely, efficiently, and at scale.

Your work will directly shape Tavily’s ability to provide AI agents with accurate, real-time knowledge of the world , bridging the gap between the open web and intelligent reasoning.

What You’ll Do

  • Build distributed data acquisition systems that capture and structure the live web
  • Investigate and analyze browser internals, fingerprinting, and anti-automation systems to develop stealthy, adaptive orchestration layers
  • Prototype and deploy intelligent automation frameworks using Playwright, Puppeteer, and low-level browser control protocols (CDP)
  • Conduct hands-on research into network flows, JavaScript-based protections, and emerging web standards affecting automation
  • Collaborate with AI and infrastructure teams to integrate real-time web data into retrieval pipelines and LLM-powered agents
  • Translate deep technical insights into production-grade components, balancing research freedom with engineering rigor
  • Continuously evolve Tavily’s capabilities in resilience, speed, and authenticity of web interaction

What We’re Looking For

  • 3–5 years of experience as a backend or systems engineer, ideally working with large-scale, distributed, or web-facing infrastructure
  • Strong programming skills in Python or Node.js, with experience in Go or C++ considered a strong plus
  • Proven experience building and maintaining browser automation systems (Playwright, Puppeteer, or CDP) in production environments
  • Solid understanding of browser internals, network protocols, and web interaction mechanisms
  • Experience designing high-performance, resilient systems that handle scale, concurrency, and complex orchestration
  • Strong debugging and analytical skills - able to investigate edge cases, performance bottlenecks, and behavior under dynamic web conditions
  • Comfortable working in a fast-moving environment, collaborating closely with product, AI, and infrastructure teams to ship reliable systems quickly
  • Excellent documentation and communication skills to ensure smooth integration and operational visibility

Nice to Have

  • Familiarity with cloud infrastructure, containerization (Docker), Kubernetes, and CI/CD
  • Experience integrating AI or retrieval systems into production pipelines

What we offer

  • Competitive salary and comprehensive benefits package.
  • Opportunities for professional growth within Nebius.
  • Flexible working arrangements.
  • A dynamic and collaborative work environment that values initiative and innovation.

We’re growing and expanding our products every day. If you’re up to the challenge and are excited about AI and ML as much as we are, join us!

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • Node.js
  • Go
  • C++
  • Playwright
  • Puppeteer
  • Chrome DevTools Protocol
  • Docker
  • Kubernetes
  • Distributed Systems
  • Web Scraping
  • Reverse Engineering

Возможные вопросы на собеседовании

Проверка глубины знаний инструментов автоматизации и понимания того, как сайты идентифицируют ботов.

Расскажите о наиболее сложной системе защиты от скрапинга, с которой вы сталкивались. Какие методы фингерпринтинга (TLS, Canvas, WebGL) они использовали и как вы их обходили?

Оценка навыков проектирования масштабируемых систем.

Как бы вы спроектировали архитектуру распределенной системы скрапинга, способной обрабатывать миллионы страниц в день, минимизируя при этом блокировки по IP и затраты на инфраструктуру?

Проверка понимания низкоуровневых протоколов, упомянутых в вакансии.

В каких случаях использование Chrome DevTools Protocol (CDP) напрямую предпочтительнее, чем использование высокоуровневых библиотек вроде Playwright или Puppeteer?

Оценка умения работать с данными для ИИ-агентов.

Как вы обеспечиваете качество и структурированность извлеченных данных из динамических веб-страниц для их последующего использования в RAG-системах?

Проверка навыков отладки в нестабильной среде веба.

Как вы организуете мониторинг и алертинг для обнаружения изменений в верстке целевых сайтов или обновлений их систем защиты до того, как это приведет к массовым отказам в пайплайне?

Похожие вакансии

careem
Не указана

Staff Software Engineer I

ГибридОАЭ
Java · Go · Kotlin · Spring · AWS · Kafka · Docker · Kubernetes · Microservices · CI/CD · GitHub Actions · Distributed Systems · System Design
+13 навыков
nice
Не указана

Software Engineer

ГибридИзраиль
Java · AWS · Amazon DynamoDB · Amazon EKS · Kubernetes · Docker · Spring Boot · Kafka · Apache Flink · Apache Spark · Terraform · Jenkins · Microservices · NoSQL · RDBMS · CI/CD · Agile
+17 навыков
nextinsurance66
Не указана

Backend Software Engineer

ГибридИзраиль
Kotlin · Java · Python · .NET · AWS · SQL · PostgreSQL · OOP · CI/CD · Distributed Systems
+10 навыков
melio
Не указана

Backend Engineer, Data Apps

В офисеИзраиль
TypeScript · Python · AWS · Spark · AWS Lambda · Amazon Bedrock · Large Language Models · Serverless · CloudFormation · AWS SAM
+10 навыков
careem
Не указана

Staff Software Engineer - Backend (AI Platform)

В офисеОАЭ
Python · Go · Node.js · Microservices · LangChain · Pinecone · Milvus · RAG · Distributed Systems · CI/CD · Vector Databases · API Design
+12 навыков
okta
Не указана

Staff Software Engineer - ISPM

В офисеИзраиль
Python · Backend Development · Software Architecture · AWS · Snowflake · Data Warehousing · Scalability · Unit Testing · Monitoring
+9 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

nebius
Страна
Израиль