yandex
N
NDA
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
MiddleУдалённоКонтракт

Инженер данных Бизнес-домена

ИИОценка ИИ

Интересный стек технологий (Greenplum, ClickHouse, Kafka) и понятная бизнес-задача в области HR-аналитики. Возможность удаленной работы из СНГ и работа по ИП/СМЗ делают вакансию привлекательной для опытных инженеров.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Роль требует глубоких практических знаний специфических инструментов, таких как Greenplum и ClickHouse, а также продвинутого владения SQL и навыков работы с Kafka в продакшене. Высокая планка ответственности за архитектуру DWH и интеграции через API повышает сложность позиции.

Анализ зарплаты

Медиана320 000 ₽
Рынок250 000 ₽ – 400 000 ₽
ИИОценка ИИ

Для позиции Middle/Middle+ Data Engineer с таким стеком (Greenplum, ClickHouse, Kafka) рыночные зарплаты в РФ и СНГ обычно находятся в диапазоне от 250 000 до 400 000 рублей. В объявлении зарплата не указана, но требования соответствуют верхнему сегменту мидл-уровня.

Сопроводительное письмо

Меня заинтересовала вакансия инженера данных в вашем бизнес-домене, так как мой опыт работы с Greenplum и ClickHouse напрямую соответствует вашим требованиям к построению высокопроизводительных хранилищ. Я имею практический опыт разработки ETL/ELT пайплайнов и глубокое понимание работы с Kafka и REST API, что позволит мне эффективно интегрировать разрозненные кадровые данные в единую аналитическую экосистему.

Особое внимание я уделяю оптимизации SQL-запросов и обеспечению консистентности данных, что критично для HR-аналитики. Я готов взять на себя ответственность за стабильность пайплайнов и развитие слоев DWH (staging, DDS, marts), используя свой опыт работы с S3-хранилищами и инструментами оркестрации. Буду рад обсудить, как мои навыки помогут вашей команде находить ответы на важные вопросы бизнеса через качественные данные.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Отправьте свое резюме @veroneko, чтобы стать ключевым звеном в аналитике HR-данных и работать с современным стеком Greenplum и ClickHouse!

Описание вакансии

ID 2611

Инженер данных Бизнес-домена

Middle/Middle+

🌍 Локация: РФ/РБ и СНГ

💼Сотрудничество : по ИП РФ, РБ СМЗ РБ

Проект:

В команде данных и аналитики по сотрудникам мы строим систему, которая отвечает на главные вопросы бизнеса: «Кто наши люди? Как они растут? Где зоны для улучшения?». Нам нужен инженер данных, который превратит разрозненные кадровые события в чистый, надежный и готовый к анализу слой данных.

Требования:

• ETL/ELT пайплайны

• работа с API

• обработка больших объемов данных

• SQL на продвинутом уровне:

• сложные join’ы, оконные функции

• оптимизация запросов под большие объемы

• понимание планов выполнения

• Практический опыт работы (не «знаком», а делал в проде):

• Greenplum (понимание MPP, распределение данных, оптимизация)

• ClickHouse (построение витрин, работа с большими таблицами)

• MS SQL Server

• Kafka:

• опыт работы с consumer/producer

• понимание семантики доставки и обработки сообщений

• Интеграции:

• уверенная работа с REST API (пагинация, ретраи, обработка ошибок)

• S3-совместимые хранилища:

• чтение/запись, организация данных, партиционирование

• Желательно:

• Опыт работы с Trino (федеративные запросы, работа с несколькими источниками)

• Опыт построения DWH (staging / dds / marts)

• Понимание data lineage и контроля качества данных

• Опыт orchestration (Airflow или аналоги)

• Важна самостоятельность и ответственность за результат

Задачи:

• Разработка и поддержка пайплайнов загрузки и трансформации HR-данных

• Интеграция источников (API, Kafka, БД, файловые хранилища)

• Построение витрин и обеспечение их консистентности

• Оптимизация производительности и стоимости обработки данных

• Обеспечение стабильности (обработка сбоев, ретраи, мониторинг)

🔎 Вопросы/резюме - в ЛС Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • SQL
  • Airflow
  • Kafka
  • ETL
  • REST API
  • S3
  • Data Lineage
  • ELT
  • ClickHouse
  • Trino
  • Data Warehouse
  • MS SQL Server
  • Greenplum

Возможные вопросы на собеседовании

Вакансия требует глубокого понимания MPP-систем.

Расскажите о принципах распределения данных (distribution keys) в Greenplum и как неправильный выбор ключа влияет на производительность джойнов?

Работа с ClickHouse предполагает построение витрин на больших объемах.

Какие движки таблиц в ClickHouse вы использовали для построения витрин и в чем преимущество семейства ReplacingMergeTree в контексте HR-данных?

Упоминается работа с Kafka (consumer/producer).

Как вы обеспечиваете семантику 'exactly-once' или 'at-least-once' при обработке сообщений из Kafka в ETL-процессах?

Требуется уверенная работа с REST API.

Как вы организуете процесс инкрементальной загрузки данных через API, если источник не поддерживает передачу даты изменения объекта?

Важен опыт оптимизации запросов.

Опишите ваш алгоритм действий при анализе плана выполнения (EXPLAIN) медленного запроса в MS SQL Server или Greenplum. На какие операторы вы смотрите в первую очередь?

Похожие вакансии

NDA
168 358 ₽ – 297 075 ₽

ML разработчик (Middle)

MiddleУдалённо
Python · Scikit-learn · Pandas · NumPy · PyTorch · TensorFlow · JAX · SQL · Spark · PySpark · Dask · Docker · Kubernetes · Git · DVC · GitLab CI · GitHub Actions · Jenkins · Prometheus · Grafana · Evidently AI · MLflow · AWS · GCP · Azure ML · Kubeflow · Airflow · FastAPI · Flask · Triton Inference Server · Feast · Tecton · Hopsworks · Horovod · Ray
+35 навыков
AT
Action tech
Не указана

Разработчик MLOps (Python)

MiddleУдалённо
Python · Git · Linux Shell · Unit Testing · CI/CD · Docker · Web Scraping · GitLab CI · Jenkins
+9 навыков
NDA
от 1 700 ₽

ML разработчик Middle Middle+

MiddleУдалённо
Python · Scikit-learn · Pandas · NumPy · PyTorch · TensorFlow · JAX · SQL · Apache Spark · PySpark · Dask · Docker · Kubernetes · Git · DVC · GitLab CI · GitHub Actions · Jenkins · Prometheus · Grafana · Evidently AI · MLflow · AWS · Google Cloud Platform · Azure ML · Kubeflow · Apache Airflow · FastAPI · Flask · Triton Inference Server · TensorFlow Serving · Feast · Tecton · Hopsworks · Horovod · Ray
+36 навыков
NDA
Не указана

Middle Data Science (Проект Альфа)

MiddleУдалённо
Data Science · Machine Learning · Statistics · Mathematics · Uplift Modeling · Python
+6 навыков
ЛП
Лемана Про Ритейл
Не указана

Middle / Middle+ Инженер данных Бизнес-домена

MiddleУдалённо
ETL · ELT · SQL · Greenplum · ClickHouse · MS SQL Server · Kafka · REST API · S3 · Trino · DWH · Airflow
+12 навыков
NDA
200 000 ₽ – 230 000 ₽

Data инженер Middle+

MiddleУдалённо
Java · Groovy · Docker · Rancher · SQL · Oracle · PostgreSQL · MySQL · Git · Apache NiFi · Airflow · Hadoop · HDFS · Hive · DWH · Data Lake · Linux · Spark · Ansible · CI/CD
+20 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

N
NDA
Страна
Россия