yandex
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorУдалённоПолная занятость

Senior Data Engineer

ИИОценка ИИ

Отличная вакансия в известной международной компании с современным стеком (Iceberg, Trino, Airflow). Четко прописанные требования и работа над продуктом с реальной нагрузкой делают позицию очень привлекательной для опытных инженеров.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Высокая сложность обусловлена требованиями к глубокому практическому опыту (5+ лет) и знанию специфических технологий Lakehouse (Iceberg) и MPP-систем (Trino). Ожидается уровень Senior не только в инженерии данных, но и в разработке на Python.

Анализ зарплаты

Медиана450 000 ₽
Рынок350 000 ₽ – 550 000 ₽
ИИОценка ИИ

Зарплата в объявлении не указана, но для позиции Senior Data Engineer с таким стеком в международной компании рыночный диапазон составляет от 350 000 до 550 000 рублей после налогов. Flowwow обычно предлагает конкурентоспособные условия, соответствующие верхнему эшелону рынка.

Сопроводительное письмо

Меня заинтересовала вакансия Senior Data Engineer в Flowwow, так как мой опыт работы с Apache Iceberg и Trino полностью соответствует вашим технологическим вызовам. Я обладаю глубокой экспертизой в построении Lakehouse-архитектур и оптимизации распределенных запросов, что критично для масштабируемого маркетплейса.

В своей практике я не только разрабатывал сложные пайплайны на Airflow и Spark, но и уделял значительное внимание качеству кода, используя принципы ООП и строгую типизацию в Python. Уверен, что мой опыт эксплуатации систем под высокой нагрузкой поможет Flowwow эффективно развивать аналитическую платформу.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Flowwow уже сейчас

Присоединяйтесь к международному маркетплейсу Flowwow и стройте современную Data-платформу на стеке Lakehouse!

Описание вакансии

*🐅 Senior Data Engineer*

Удалёнка Флаувау— международный маркетплейс подарков.

Требования:

– 5+ лет в data engineering или backend с дата-уклоном. Production-опыт под реальной нагрузкой с ответственностью за эксплуатацию.

– Python — senior-уровень: ООП, проектирование API, типизация, тесты, переиспользуемые компоненты.

– Lakehouse — Apache Iceberg (или Delta/Hudi): устройство таблиц, snapshots, компакция, schema evolution. Разница между lakehouse и DWH на практике, не в теории.

– Trino или другой MPP: распределённое выполнение, чтение планов запросов, оптимизация, коннекторы.

– Airflow глубоко: scheduler, executors, метаданные, собственные операторы и хуки.

– Spark — PySpark, Spark SQL, модель выполнения.

– SQL — оконные функции, CTE, оптимизация, планы исполнения, большие объёмы.

– Git, CI/CD — уверенно.

*➡️*Откликнуться

*📍 Навигация:[База знаний](https://t.me/pyproglib) [Задачи](https://t.me/py_problems_lib) * Собеседования

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • Apache Iceberg
  • Trino
  • Apache Airflow
  • Apache Spark
  • PySpark
  • SQL
  • Git
  • CI/CD
  • OOP
  • API Design
  • Delta Lake
  • Apache Hudi

Возможные вопросы на собеседовании

Вакансия требует глубокого понимания Lakehouse. Важно знать, как управлять жизненным циклом данных.

Расскажите о вашем опыте работы с Apache Iceberg: как вы решали задачи компакции мелких файлов и управления эволюцией схем?

Trino используется для высоконагруженных запросов. Кандидат должен уметь их оптимизировать.

Как вы анализируете план выполнения запроса в Trino? На какие метрики и операторы обращаете внимание при поиске узких мест?

Требуется глубокое знание Airflow, включая внутреннее устройство.

В каких случаях вы бы предпочли написать собственный Operator или Hook в Airflow вместо использования стандартных? Приведите пример из практики.

Позиция подразумевает Senior-уровень владения Python.

Как вы организуете тестирование и типизацию в больших проектах по обработке данных на Python, чтобы обеспечить поддерживаемость кода?

Работа с большими данными требует понимания распределенных вычислений.

Объясните разницу в моделях выполнения Spark и Trino. В каких сценариях лучше использовать каждый из этих инструментов?

Похожие вакансии

NDA
160 000 ₽ – 220 000 ₽

Python разработчик (DWH/Data Engineering)

SeniorУдалённо
Python · SQL · PostgreSQL · ClickHouse · Apache Airflow · Kafka · Debezium · Docker · Kubernetes · Git · CI/CD · Apache Superset · Data Vault 2.0 · Apache Flink · Apache Spark
+15 навыков
NDA
1 900 ₽ – 2 000 ₽

Data Scientist Middle+, Senior

SeniorУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Machine Learning · Data Science · Feature Engineering · Spark MLlib · Pandas
+12 навыков
J
JETLYN
270 000 ₽ – 330 000 ₽

Data Scientist

SeniorУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Spark MLlib · Feature Engineering · Machine Learning · Time Series
+11 навыков
OS
Omega Solutions
150 000 ₽ – 250 000 ₽

Middle+ Data инженер

SeniorУдалённо
SQL · Python · Pandas · NumPy · Airflow · PostgreSQL · ETL
+7 навыков
NDA
до 265 000 ₽

Senior ML/LLM Инженер

SeniorУдалённо
Python · SQL · Git · Docker · LLM · RAG · Prompt Engineering · NLP · Machine Learning
+9 навыков
С
Сбер
Не указана

Senior ML аналитик (Kandinsky)

SeniorУдалённо
Python · SQL · Machine Learning · Data Science · Statistics · Data Analysis · Computer Science · Root Cause Analysis · Data Visualization · Generative AI
+10 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!