Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

УдалённоПолная занятость

Data Engineer / Рекомендации

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Wildberries — крупнейший ритейлер с огромными объемами данных, что гарантирует интересные инженерные вызовы. Стек технологий современный (Iceberg, Trino), а удаленный формат работы делает вакансию очень привлекательной.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует уверенного владения стеком Big Data (Hadoop, Spark, Trino) и специфического опыта работы с Greenplum и Iceberg. Основная сложность заключается в задачах по миграции архитектуры и оптимизации высоконагруженных ETL-процессов.

Анализ зарплаты

Медиана400 000 ₽

Рынок300 000 ₽ – 550 000 ₽

Зарплата в объявлении не указана, однако для Senior Data Engineer в российском BigTech (уровня Wildberries) рыночный диапазон составляет от 300 000 до 500 000 рублей после вычета налогов. Предложение, скорее всего, будет соответствовать этим ожиданиям в зависимости от грейда кандидата.

Меня заинтересовала вакансия Data Engineer в команде рекомендаций Wildberries, так как мой опыт работы с MPP-системами и построением ETL-процессов полностью соответствует вашим задачам. Я имею глубокую экспертизу в работе с Greenplum и Airflow, а также опыт оптимизации сложных пайплайнов данных, что позволит мне эффективно поддерживать и развивать текущую инфраструктуру.

Особый интерес вызывает проект по миграции на Iceberg. Я знаком с принципами работы объектных хранилищ и понимаю нюансы проектирования слоев данных с учетом schema evolution и snapshot management. Уверен, что мои навыки работы с Trino и Spark помогут команде успешно реализовать переход на новые технологические рельсы и повысить производительность систем.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Wildberries уже сейчас

Присоединяйтесь к команде Wildberries и создавайте высоконагруженные системы рекомендаций для миллионов пользователей!

Описание вакансии

Data Engineer / Рекомендации

#удаленка

Компания: Wildberries

*🔹*Что нужно делать

-Поддерживать пайплайны на Greenplum;

сопровождать и оптимизировать существующие ETL/ELT-процессы: мониторинг, диагностика деградаций, партиционирование, работа с каталогом;

-заниматься интеграциями новых источников;

-подключать новые продуктовые команды и внешние источники: технический ресёрч, проектирование схем интеграции, data contracts.

Взаимодействие с владельцами источников на уровне технических требований;

-участие в миграции: перепроектирование слоёв под Iceberg (partitioning, schema evolution, snapshot management), понимание компромиссов MPP vs object storage.

*🔹*Какой опыт и знания нужны

-Владеете опытом с Airflow как оркестратором;

-имеете работы с Hadoop (Spark/Yarn/Hdfs);

-имеете работы c Greenplum или другими MPP-системами;

-работали с Trino как query engine.

Откликнуться

*🔥* Подписаться на наши каналы / @best_itjob / @it_rab

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Greenplum
ETL
ELT
Apache Iceberg
Apache Airflow
Hadoop
Apache Spark
Apache YARN
HDFS
Trino
Data Contracts
MPP
Object Storage

Возможные вопросы на собеседовании

Вакансия предполагает миграцию на Iceberg, важно понимать опыт кандидата с современными форматами таблиц.

Расскажите о вашем опыте работы с Apache Iceberg: какие преимущества он дает по сравнению с классическим Hive-подходом в контексте schema evolution?

Работа с Greenplum является ключевой частью текущих задач.

С какими основными проблемами производительности в Greenplum вы сталкивались и какие стратегии партиционирования использовали для их решения?

Trino используется как query engine, важно понимать навыки оптимизации запросов.

Как вы подходите к оптимизации запросов в Trino при работе с большими объемами данных в объектном хранилище?

Data Contracts упомянуты в задачах по интеграции новых источников.

Как вы организуете процесс внедрения Data Contracts при взаимодействии с продуктовыми командами?

Airflow — основной оркестратор в стеке.

Опишите ваш подход к обработке ошибок и обеспечению идемпотентности в сложных DAG-ах Airflow.

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

Data Engineer / Рекомендации

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Wildberries уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте работы с Apache Iceberg: какие преимущества он дает по сравнению с классическим Hive-подходом в контексте schema evolution?

С какими основными проблемами производительности в Greenplum вы сталкивались и какие стратегии партиционирования использовали для их решения?

Как вы подходите к оптимизации запросов в Trino при работе с большими объемами данных в объектном хранилище?

Как вы организуете процесс внедрения Data Contracts при взаимодействии с продуктовыми командами?

Опишите ваш подход к обработке ошибок и обеспечению идемпотентности в сложных DAG-ах Airflow.

Похожие вакансии

DWH аналитик

Data инженер

Стажер HR-аналитик

Junior Data analyst

Аналитик по данным (Senior)

Python разработчик (DWH/Data Engineer)

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Data Engineer / Рекомендации

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Wildberries уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте работы с Apache Iceberg: какие преимущества он дает по сравнению с классическим Hive-подходом в контексте schema evolution?

С какими основными проблемами производительности в Greenplum вы сталкивались и какие стратегии партиционирования использовали для их решения?

Как вы подходите к оптимизации запросов в Trino при работе с большими объемами данных в объектном хранилище?

Как вы организуете процесс внедрения Data Contracts при взаимодействии с продуктовыми командами?

Опишите ваш подход к обработке ошибок и обеспечению идемпотентности в сложных DAG-ах Airflow.

Похожие вакансии

DWH аналитик

Data инженер

Стажер HR-аналитик

Junior Data analyst

Аналитик по данным (Senior)

Python разработчик (DWH/Data Engineer)

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ