- Страна
- Россия
Откликайтесь
на вакансии с ИИ

Senior Data Analyst / Data Engineer (Big Data / ETL)
Сильная вакансия для опытных инженеров с актуальным стеком технологий (Spark, Greenplum, ClickHouse). Четко прописанные задачи и долгосрочный характер проекта делают предложение привлекательным, хотя требование гражданства РФ ограничивает круг кандидатов.
Сложность вакансии
Высокая сложность обусловлена требованием Senior-уровня и специфическим стеком: необходимо не только знать SQL и Big Data (Spark, Hadoop), но и быть готовым работать с Java-стеком в контексте ETL. Роль совмещает аналитику и инженерию данных, что требует глубокого понимания архитектуры распределенных систем.
Анализ зарплаты
Указанный стек технологий (Senior Big Data/ETL) на московском рынке обычно оценивается в диапазоне 350 000 – 500 000 рублей. Вакансия соответствует рыночным ожиданиям для специалистов такого уровня в финтехе или крупных ИТ-компаниях.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Если вы готовы проектировать сложные ETL-пайплайны на Java и Spark, отправьте свое резюме Яне прямо сейчас!
Описание вакансии
🚀 Мы ищем: Senior Data Analyst / Data Engineer (Big Data / ETL)
🌍 Локация — Москва (только кандидаты с гражданством РФ)
🕒 Формат — Full-time
⏳ Длительность — долгосрочный проект
Ищем Senior Data Analyst с сильной экспертизой в Big Data и ETL-процессах. Роль на стыке аналитики и data engineering — работа с распределёнными системами, построение витрин данных и оптимизация пайплайнов.
🛠 Стек и технологии
Big Data: Apache Spark · Hadoop (HDFS, Hive)
БД: Greenplum · ClickHouse · PostgreSQL
ETL: Data pipelines · Оркестрация · Оптимизация
Языки: SQL (продвинутый) · Java (будет использоваться)
BI: Superset
Архитектура: Распределённые системы
📋 Задачи
✅ Разработка ETL на Apache Spark (Java стек)
✅ Построение и развитие ETL-пайплайнов (Spark, HDFS, Hive, Greenplum, ClickHouse)
✅ Разработка витрин данных
✅ Оркестрация ETL-процессов
✅ Оптимизация пайплайнов (батчинг, ретраи, SLA)
✅ Работа с большими объёмами данных
✅ Взаимодействие с BI и DevOps командами (доставка данных в Superset)
✅ Анализ данных и подготовка инсайтов для бизнеса
🎯 Требования
Опыт работы Data Analyst / Data Engineer уровня Senior
Опыт работы с Apache Spark от 1 года
Опыт работы с СУБД (Greenplum, ClickHouse, PostgreSQL) от 2 лет
Опыт работы с Hadoop (HDFS, Hive)
Продвинутые знания SQL
Опыт построения и оптимизации ETL-пайплайнов
Понимание принципов работы распределённых систем
Опыт работы с большими объёмами данных
Готовность использовать Java (Spark стек)
💡 Будет плюсом
Опыт разработки на Java
Опыт миграции данных или BI-платформ
Опыт в банковской сфере
Опыт работы в крупных high-load проектах
🧠 Софт-скиллы
Сильное аналитическое мышление
Умение работать с комплексными системами
Самостоятельность и ответственность
Хорошая коммуникация с кросс-функциональными командами
💬 Интересно или есть рекомендации?
Пишите:
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- SQL
- PostgreSQL
- Apache Spark
- Hadoop
- Java
- ETL
- Big Data
- Hive
- HDFS
- ClickHouse
- Apache Superset
- Greenplum
Возможные вопросы на собеседовании
Проверка практического опыта оптимизации производительности в распределенных системах.
Расскажите о наиболее сложной проблеме производительности в Spark-пайплайне, с которой вы столкнулись, и как вы её решили (например, data skew или memory management)?
Вакансия предполагает работу с Greenplum и ClickHouse; важно понимать, когда и какую БД использовать.
В каких сценариях вы бы предпочли использовать ClickHouse вместо Greenplum для построения витрин данных, и наоборот?
Проверка готовности кандидата использовать Java для задач обработки данных.
Какие преимущества и недостатки вы видите в использовании Java API для Spark по сравнению с PySpark в контексте долгосрочной поддержки ETL-проектов?
Оценка навыков проектирования надежных систем.
Как вы организуете мониторинг и обработку ошибок (retries, dead-letter queues) в своих ETL-пайплайнах для обеспечения SLA?
Проверка понимания специфики Hadoop.
Как устроено хранение данных в HDFS и как выбор формата файлов (например, Parquet или ORC) влияет на скорость выполнения SQL-запросов в Hive?
Похожие вакансии
Data аналитик (Senior)
Аналитик данных (финтех)
Data Analyst
SENIOR АНАЛИТИК (КХД / DWH)
Senior Data Analyst
Разработчик хранилищ данных (Senior)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Россия