Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

SeniorВ офисеПолная занятость

Senior Data Analyst / Data Engineer (Big Data / ETL)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Сильная вакансия для опытных инженеров с актуальным стеком технологий (Spark, Greenplum, ClickHouse). Четко прописанные задачи и долгосрочный характер проекта делают предложение привлекательным, хотя требование гражданства РФ ограничивает круг кандидатов.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена требованием Senior-уровня и специфическим стеком: необходимо не только знать SQL и Big Data (Spark, Hadoop), но и быть готовым работать с Java-стеком в контексте ETL. Роль совмещает аналитику и инженерию данных, что требует глубокого понимания архитектуры распределенных систем.

Анализ зарплаты

Медиана420 000 ₽

Рынок350 000 ₽ – 550 000 ₽

Указанный стек технологий (Senior Big Data/ETL) на московском рынке обычно оценивается в диапазоне 350 000 – 500 000 рублей. Вакансия соответствует рыночным ожиданиям для специалистов такого уровня в финтехе или крупных ИТ-компаниях.

Меня заинтересовала вакансия Senior Data Analyst / Data Engineer, так как она идеально сочетает в себе глубокую аналитику и инженерные задачи. Имея значительный опыт работы с распределенными системами, такими как Hadoop и Spark, я специализируюсь на построении отказоустойчивых ETL-процессов и оптимизации витрин данных в Greenplum и ClickHouse.

Особенно привлекает возможность работы на стыке технологий, включая использование Java для Spark-стека. Я обладаю навыками настройки оркестрации и обеспечения SLA для батчевой обработки данных, что позволит мне эффективно решать задачи по доставке качественных инсайтов в Superset. Уверен, что мой опыт в High-load проектах принесет значительную пользу вашей команде.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Если вы готовы проектировать сложные ETL-пайплайны на Java и Spark, отправьте свое резюме Яне прямо сейчас!

Описание вакансии

🚀 Мы ищем: Senior Data Analyst / Data Engineer (Big Data / ETL)

🌍 Локация — Москва (только кандидаты с гражданством РФ)

🕒 Формат — Full-time

⏳ Длительность — долгосрочный проект

Ищем Senior Data Analyst с сильной экспертизой в Big Data и ETL-процессах. Роль на стыке аналитики и data engineering — работа с распределёнными системами, построение витрин данных и оптимизация пайплайнов.

🛠 Стек и технологии

Big Data: Apache Spark · Hadoop (HDFS, Hive)

БД: Greenplum · ClickHouse · PostgreSQL

ETL: Data pipelines · Оркестрация · Оптимизация

Языки: SQL (продвинутый) · Java (будет использоваться)

BI: Superset

Архитектура: Распределённые системы

📋 Задачи

✅ Разработка ETL на Apache Spark (Java стек)

✅ Построение и развитие ETL-пайплайнов (Spark, HDFS, Hive, Greenplum, ClickHouse)

✅ Разработка витрин данных

✅ Оркестрация ETL-процессов

✅ Оптимизация пайплайнов (батчинг, ретраи, SLA)

✅ Работа с большими объёмами данных

✅ Взаимодействие с BI и DevOps командами (доставка данных в Superset)

✅ Анализ данных и подготовка инсайтов для бизнеса

🎯 Требования

Опыт работы Data Analyst / Data Engineer уровня Senior

Опыт работы с Apache Spark от 1 года

Опыт работы с СУБД (Greenplum, ClickHouse, PostgreSQL) от 2 лет

Опыт работы с Hadoop (HDFS, Hive)

Продвинутые знания SQL

Опыт построения и оптимизации ETL-пайплайнов

Понимание принципов работы распределённых систем

Опыт работы с большими объёмами данных

Готовность использовать Java (Spark стек)

💡 Будет плюсом

Опыт разработки на Java

Опыт миграции данных или BI-платформ

Опыт в банковской сфере

Опыт работы в крупных high-load проектах

🧠 Софт-скиллы

Сильное аналитическое мышление

Умение работать с комплексными системами

Самостоятельность и ответственность

Хорошая коммуникация с кросс-функциональными командами

💬 Интересно или есть рекомендации?

Пишите:

Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Apache Spark
Hadoop
HDFS
Hive
Greenplum
ClickHouse
PostgreSQL
ETL
SQL
Java
Apache Superset
Big Data

Возможные вопросы на собеседовании

Проверка практического опыта оптимизации производительности в распределенных системах.

Расскажите о наиболее сложной проблеме производительности в Spark-пайплайне, с которой вы столкнулись, и как вы её решили (например, data skew или memory management)?

Вакансия предполагает работу с Greenplum и ClickHouse; важно понимать, когда и какую БД использовать.

В каких сценариях вы бы предпочли использовать ClickHouse вместо Greenplum для построения витрин данных, и наоборот?

Проверка готовности кандидата использовать Java для задач обработки данных.

Какие преимущества и недостатки вы видите в использовании Java API для Spark по сравнению с PySpark в контексте долгосрочной поддержки ETL-проектов?

Оценка навыков проектирования надежных систем.

Как вы организуете мониторинг и обработку ошибок (retries, dead-letter queues) в своих ETL-пайплайнах для обеспечения SLA?

Проверка понимания специфики Hadoop.

Как устроено хранение данных в HDFS и как выбор формата файлов (например, Parquet или ORC) влияет на скорость выполнения SQL-запросов в Hive?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

Senior Data Analyst / Data Engineer (Big Data / ETL)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о наиболее сложной проблеме производительности в Spark-пайплайне, с которой вы столкнулись, и как вы её решили (например, data skew или memory management)?

В каких сценариях вы бы предпочли использовать ClickHouse вместо Greenplum для построения витрин данных, и наоборот?

Какие преимущества и недостатки вы видите в использовании Java API для Spark по сравнению с PySpark в контексте долгосрочной поддержки ETL-проектов?

Как вы организуете мониторинг и обработку ошибок (retries, dead-letter queues) в своих ETL-пайплайнах для обеспечения SLA?

Как устроено хранение данных в HDFS и как выбор формата файлов (например, Parquet или ORC) влияет на скорость выполнения SQL-запросов в Hive?

Похожие вакансии

DWH аналитик

Data инженер

Senior Аналитик КХД (DWH)

Аналитик по данным (Senior)

Python разработчик (DWH/Data Engineer)

Аналитик 1С MDM/Data Quality (Middle+/Senior)

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Senior Data Analyst / Data Engineer (Big Data / ETL)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о наиболее сложной проблеме производительности в Spark-пайплайне, с которой вы столкнулись, и как вы её решили (например, data skew или memory management)?

В каких сценариях вы бы предпочли использовать ClickHouse вместо Greenplum для построения витрин данных, и наоборот?

Какие преимущества и недостатки вы видите в использовании Java API для Spark по сравнению с PySpark в контексте долгосрочной поддержки ETL-проектов?

Как вы организуете мониторинг и обработку ошибок (retries, dead-letter queues) в своих ETL-пайплайнах для обеспечения SLA?

Как устроено хранение данных в HDFS и как выбор формата файлов (например, Parquet или ORC) влияет на скорость выполнения SQL-запросов в Hive?

Похожие вакансии

DWH аналитик

Data инженер

Senior Аналитик КХД (DWH)

Аналитик по данным (Senior)

Python разработчик (DWH/Data Engineer)

Аналитик 1С MDM/Data Quality (Middle+/Senior)

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ