yandex
N
NDA
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
SeniorВ офисеПолная занятость

Senior Data Analyst / Data Engineer (Big Data / ETL)

ИИОценка ИИ

Сильная вакансия для опытных инженеров с актуальным стеком технологий (Spark, Greenplum, ClickHouse). Четко прописанные задачи и долгосрочный характер проекта делают предложение привлекательным, хотя требование гражданства РФ ограничивает круг кандидатов.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Высокая сложность обусловлена требованием Senior-уровня и специфическим стеком: необходимо не только знать SQL и Big Data (Spark, Hadoop), но и быть готовым работать с Java-стеком в контексте ETL. Роль совмещает аналитику и инженерию данных, что требует глубокого понимания архитектуры распределенных систем.

Анализ зарплаты

Медиана420 000 ₽
Рынок350 000 ₽ – 550 000 ₽
ИИОценка ИИ

Указанный стек технологий (Senior Big Data/ETL) на московском рынке обычно оценивается в диапазоне 350 000 – 500 000 рублей. Вакансия соответствует рыночным ожиданиям для специалистов такого уровня в финтехе или крупных ИТ-компаниях.

Сопроводительное письмо

Меня заинтересовала вакансия Senior Data Analyst / Data Engineer, так как она идеально сочетает в себе глубокую аналитику и инженерные задачи. Имея значительный опыт работы с распределенными системами, такими как Hadoop и Spark, я специализируюсь на построении отказоустойчивых ETL-процессов и оптимизации витрин данных в Greenplum и ClickHouse.

Особенно привлекает возможность работы на стыке технологий, включая использование Java для Spark-стека. Я обладаю навыками настройки оркестрации и обеспечения SLA для батчевой обработки данных, что позволит мне эффективно решать задачи по доставке качественных инсайтов в Superset. Уверен, что мой опыт в High-load проектах принесет значительную пользу вашей команде.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Если вы готовы проектировать сложные ETL-пайплайны на Java и Spark, отправьте свое резюме Яне прямо сейчас!

Описание вакансии

🚀 Мы ищем: Senior Data Analyst / Data Engineer (Big Data / ETL)

🌍 Локация — Москва (только кандидаты с гражданством РФ)

🕒 Формат — Full-time

⏳ Длительность — долгосрочный проект

Ищем Senior Data Analyst с сильной экспертизой в Big Data и ETL-процессах. Роль на стыке аналитики и data engineering — работа с распределёнными системами, построение витрин данных и оптимизация пайплайнов.

🛠 Стек и технологии

Big Data: Apache Spark · Hadoop (HDFS, Hive)

БД: Greenplum · ClickHouse · PostgreSQL

ETL: Data pipelines · Оркестрация · Оптимизация

Языки: SQL (продвинутый) · Java (будет использоваться)

BI: Superset

Архитектура: Распределённые системы

📋 Задачи

✅ Разработка ETL на Apache Spark (Java стек)

✅ Построение и развитие ETL-пайплайнов (Spark, HDFS, Hive, Greenplum, ClickHouse)

✅ Разработка витрин данных

✅ Оркестрация ETL-процессов

✅ Оптимизация пайплайнов (батчинг, ретраи, SLA)

✅ Работа с большими объёмами данных

✅ Взаимодействие с BI и DevOps командами (доставка данных в Superset)

✅ Анализ данных и подготовка инсайтов для бизнеса

🎯 Требования

Опыт работы Data Analyst / Data Engineer уровня Senior

Опыт работы с Apache Spark от 1 года

Опыт работы с СУБД (Greenplum, ClickHouse, PostgreSQL) от 2 лет

Опыт работы с Hadoop (HDFS, Hive)

Продвинутые знания SQL

Опыт построения и оптимизации ETL-пайплайнов

Понимание принципов работы распределённых систем

Опыт работы с большими объёмами данных

Готовность использовать Java (Spark стек)

💡 Будет плюсом

Опыт разработки на Java

Опыт миграции данных или BI-платформ

Опыт в банковской сфере

Опыт работы в крупных high-load проектах

🧠 Софт-скиллы

Сильное аналитическое мышление

Умение работать с комплексными системами

Самостоятельность и ответственность

Хорошая коммуникация с кросс-функциональными командами

💬 Интересно или есть рекомендации?

Пишите:

Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • SQL
  • PostgreSQL
  • Apache Spark
  • Hadoop
  • Java
  • ETL
  • Big Data
  • Hive
  • HDFS
  • ClickHouse
  • Apache Superset
  • Greenplum

Возможные вопросы на собеседовании

Проверка практического опыта оптимизации производительности в распределенных системах.

Расскажите о наиболее сложной проблеме производительности в Spark-пайплайне, с которой вы столкнулись, и как вы её решили (например, data skew или memory management)?

Вакансия предполагает работу с Greenplum и ClickHouse; важно понимать, когда и какую БД использовать.

В каких сценариях вы бы предпочли использовать ClickHouse вместо Greenplum для построения витрин данных, и наоборот?

Проверка готовности кандидата использовать Java для задач обработки данных.

Какие преимущества и недостатки вы видите в использовании Java API для Spark по сравнению с PySpark в контексте долгосрочной поддержки ETL-проектов?

Оценка навыков проектирования надежных систем.

Как вы организуете мониторинг и обработку ошибок (retries, dead-letter queues) в своих ETL-пайплайнах для обеспечения SLA?

Проверка понимания специфики Hadoop.

Как устроено хранение данных в HDFS и как выбор формата файлов (например, Parquet или ORC) влияет на скорость выполнения SQL-запросов в Hive?

Похожие вакансии

более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

N
NDA
Страна
Россия