yandex
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorУдалённоКонтракт

Data Engineer

ИИОценка ИИ

Интересный стек технологий (Spark 3, Iceberg, Trino) и работа с реальным Big Data. Четко прописанные требования и понятные задачи по развитию платформы прогнозирования спроса делают вакансию привлекательной для опытных инженеров.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Роль требует глубокой экспертизы в архитектуре Spark и Airflow, а также опыта работы с огромными объемами данных (100+ млн строк). Высокие требования к навыкам оптимизации и пониманию внутренних процессов РСУБД делают позицию сложной для кандидатов без серьезного бэкграунда в Big Data.

Анализ зарплаты

Медиана400 000 ₽
Рынок300 000 ₽ – 550 000 ₽
ИИОценка ИИ

Зарплата не указана, но для уровня Senior Data Engineer на рынках РФ и РБ медиана составляет около 350,000 - 450,000 рублей. Учитывая требования к глубокому знанию Spark и Airflow, позиция должна оплачиваться по верхней границе рынка.

Сопроводительное письмо

Меня заинтересовала вакансия Senior Data Engineer в Eclipse Digital, так как мой опыт работы с PySpark и Apache Airflow идеально соответствует вашим задачам по обработке 200+ млн строк ежедневно. Я обладаю глубоким пониманием архитектуры Spark, включая оптимизацию shuffle и борьбу с data skew, а также имею опыт работы с форматами Iceberg и Parquet в высоконагруженных системах.

В своей практике я не раз решал задачи по динамической генерации DAGов в Airflow и оптимизации сложных SQL-запросов для DWH. Уверен, что мои навыки в построении надежных пайплайнов данных помогут вашей Data Science-команде получать качественные фичи для моделей прогнозирования спроса в кратчайшие сроки.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Eclipse Digital уже сейчас

Присоединяйтесь к Eclipse Digital и создавайте масштабируемые системы обработки данных для прогнозирования спроса!

Описание вакансии

ID 2325

Data Engineer

Senior

🌍 Локация: РФ, РБ

💼Сотрудничество : по ИП РФ, СМЗ РБ

Eclipse Digital - наниматель

Требования:

  1. PySpark & большие данные

PySpark (Spark 2 и 3) — уверенное владение. Глубокое понимание архитектуры Spark: executors, драйвер, shuffle, стадии выполнения, Catalyst optimizer, управление памятью. Навыки оптимизации: broadcast join, bucketing, partitioning, борьба с data skew, настройка параллелизма. Spark SQL — сложные аналитические запросы. Опыт работы с объёмами 100+ млн строк ежедневно.

  1. Хранилища и форматы

HDFS / S3. Trino. Форматы: ORC / Parquet / Iceberg.

  1. Оркестрация

Apache Airflow — понимание архитектуры: scheduler, executor (Celery/Kubernetes), worker, метабаза. Написание DAGов, сенсоры, retries, SLA, backfill. Умение решать нестандартные задачи: кастомные операторы и хуки, динамическая генерация DAGов, управление зависимостями между пайплайнами, отладка и диагностика проблем в продакшене.

  1. Python

Python 3 уверенно. Pandas, NumPy — уверенное владение. pytest.

  1. SQL и РСУБД

Понимание работы РСУБД под капотом: планировщик запросов, индексы, статистика, блокировки. Навыки глубокой оптимизации запросов. Оконные функции, CTE, сложные аналитические конструкции.

  1. Инфраструктура

Kubernetes, YARN — на общем уровне.

Будет плюсом

Greenplum, ClickHouse.

Что предстоит

• Разрабатывать и оптимизировать Spark-пайплайны для обработки данных в масштабе (200+ млн строк ежедневно)

• Настраивать хранение и доступность данных в DWH

• Автоматизировать интеграцию данных: продажи, акции, цены, остатки, погода, календари

• Работать в связке с Data Science-командой, обеспечивая стабильный и качественный поток данных для моделей

• Участвовать в развитии платформы прогнозирования спроса, делая её более надёжной, масштабируемой и удобной

Откликнуться можно в telegram Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • NumPy
  • Pandas
  • SQL
  • Kubernetes
  • PySpark
  • Apache Spark
  • Apache Iceberg
  • Apache Airflow
  • PyTest
  • Amazon S3
  • HDFS
  • ClickHouse
  • Trino
  • Apache Parquet
  • Greenplum
  • Apache Hadoop YARN

Возможные вопросы на собеседовании

Проверка понимания внутренних механизмов Spark для оптимизации производительности.

Расскажите, как вы боретесь с проблемой Data Skew в PySpark? Какие стратегии, помимо Salting, вы применяли на практике?

Оценка опыта работы с оркестрацией в сложных инфраструктурах.

Как вы организуете управление зависимостями между DAGами в Airflow, если данные в целевой таблице должны быть готовы до запуска нескольких потребителей?

Проверка навыков проектирования хранилищ данных.

В каких случаях вы выберете формат Iceberg вместо обычного Parquet, и какие преимущества это даст при работе с Trino?

Оценка навыков оптимизации SQL.

Как работает Catalyst Optimizer в Spark SQL и как можно повлиять на план выполнения запроса, если автоматическая оптимизация неэффективна?

Проверка умения работать в связке с DS-командой.

Опишите ваш подход к обеспечению качества данных (Data Quality) в пайплайнах, которые питают ML-модели.

Похожие вакансии

NDA
2 000 ₽ – 2 500 ₽

ML разработчик (Senior)

SeniorУдалённо
n8n · Generative AI · Python · JavaScript · TypeScript · React · LangChain · PostgreSQL · REST · GraphQL · FastAPI · RAG · Vector Database · Prompt Engineering
+14 навыков
КС
КВИКЛИ СЕЧ ИТ
300 000 ₽ – 450 000 ₽

Senior / Middle+ Data Scientist

SeniorУдалённо
Python · Apache Spark · Machine Learning · Recommendation Systems · Ranking · NLP · LLM · MLOps · A/B Testing · Uplift Modeling
+10 навыков
S
Selecty
220 000 ₽ – 310 000 ₽

MlOps / Python Backend Engineer (ML)

SeniorУдалённо
Python · FastAPI · Flask · Kafka · Docker · Kubernetes · Airflow · Spark · Hive · SQL · MLOps · NLP · Computer Vision
+13 навыков
NDA
от 2 000 ₽

Data Scientist Senior

SeniorУдалённо
Python · Pandas · NumPy · Matplotlib · Seaborn · Plotly · Scikit-learn · SciPy · statsmodels · CatBoost · XGBoost · LightGBM · ARIMA · Prophet · Deep Learning · CNN · RNN · LSTM · Attention · Feature Engineering · tsfresh · EDA
+22 навыков
З
Зонтик
до 390 000 ₽

Senior/Middle Data Engineer

SeniorУдалённо
SQL · Python · C++ · ETL · BI · REST API · JSON · XML · Message Broker · OOP
+10 навыков
C
Centicore
340 000 ₽ – 360 000 ₽

Senior Data Scientist

SeniorУдалённо
Python · Machine Learning · Uplift Modeling · LightGBM · XGBoost · CatBoost · Scikit-learn · Pandas · NumPy · SQL · Apache Spark · Hadoop · Apache Hive · MLOps
+14 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия