yandex
N
NDA
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
MiddleУдалённоПолная занятость

Data инженер (Middle)

ИИОценка ИИ

Отличное предложение для Middle-специалиста с очень современным и востребованным стеком технологий (Lakehouse, Iceberg, Trino). Гибкость в локации и полная занятость делают вакансию привлекательной на текущем рынке.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Роль требует уверенного владения широким спектром инструментов Big Data (Spark, Airflow, Trino, Iceberg) и понимания архитектуры Lakehouse. Необходимость знания Java в дополнение к Python и SQL повышает порог входа для кандидатов уровня Middle.

Анализ зарплаты

Медиана320 000 ₽
Рынок250 000 ₽ – 400 000 ₽
ИИОценка ИИ

Указанный стек технологий (Big Data) обычно оплачивается выше среднего по рынку РФ. Для уровня Middle в этой нише зарплаты часто начинаются от 250 000 рублей и могут достигать 400 000 рублей в зависимости от глубины знаний Spark и Java.

Сопроводительное письмо

Меня заинтересовала вакансия Data инженера, так как мой опыт работы со стеком Greenplum, Airflow и Spark полностью соответствует вашим требованиям. Я обладаю глубокими знаниями SQL и Python, а также имею практический опыт построения интеграционных потоков и витрин данных в архитектуре Lakehouse.

Особенно меня привлекает возможность работы с такими инструментами, как Trino, Iceberg и dbt. Я уверен, что мои навыки оптимизации запросов и опыт поддержки документации помогут вашей команде эффективно развивать платформу больших данных. Буду рад обсудить, как мой опыт может быть полезен вашему проекту.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Отправьте свое резюме @ivanGr прямо сейчас, чтобы присоединиться к команде и работать с современным стеком Lakehouse!

Описание вакансии

#9455

Data инженер (Middle)

Локация: Любая

Гражданство: РФ/РБ

Загрузка: Full-time

Требования:

  • Стек: Greenplum, Trino, Apache Airflow, ClickHouse, Python, Spark, SQL (dbt), S3, Hadoop
  • Сбор требований с бизнес-заказчиков и анализ источников данных
  • Разработка, реализация и поддержка интеграционных потоков, а также потоков сборки витрин-данных на стеке: Trino, Iceberg, S3, Spark, Apache Airflow, Kafka, Cosmos, Flink
  • Оперативное реагирование на проблемы, выполнение типовых задач в срок
  • Поддержание документации типовых интеграционных решений платформы больших данных
  • Общее представление о стеке Lakehouse
  • Понимание различий между BigData/Lakehouse и обычными данными
  • Знание SQL (индексы, функции, оптимизация, профилирование)
  • Знание Java, Python
  • Опыт работы с реляционными БД (Oracle, Postgres, MySQL, MsSQL и т.п.)
  • Умение работать с Git (pull/commit/push)
  • Опыт работы с DBT, Cosmos, Ni-Fi
  • Опыт разработки на Spark
  • Понимание особенностей Trino
  • Понимание форматов данных Iceberg, Parquet, Avro
  • Понимание работы с minio или S3-хранилищами
  • Опыт использования системами ведения проектов и документации

Писать Откликнуться

Канал Аутстаф запросов Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Greenplum
  • Trino
  • Apache Airflow
  • ClickHouse
  • Python
  • Spark
  • SQL
  • dbt
  • S3
  • Hadoop
  • Iceberg
  • Kafka
  • Cosmos
  • Apache Flink
  • Java
  • PostgreSQL
  • Oracle
  • MySQL
  • Microsoft SQL Server
  • Git
  • Apache NiFi
  • Parquet
  • Avro
  • MinIO

Возможные вопросы на собеседовании

Вакансия предполагает работу с Lakehouse, поэтому важно понимать преимущества Iceberg перед классическими форматами.

В чем заключаются основные преимущества использования формата таблиц Iceberg в архитектуре Lakehouse по сравнению с обычным Parquet?

Trino указан как один из ключевых инструментов для обработки данных.

Расскажите об особенностях оптимизации запросов в Trino. Как работает механизм динамической фильтрации (Dynamic Filtering)?

Spark является основным инструментом обработки, важно знать нюансы его работы.

Как вы боретесь с проблемой перекоса данных (Data Skew) при выполнении Join-операций в Spark?

dbt и Cosmos используются для трансформации данных.

Каким образом вы организуете тестирование качества данных (Data Quality) при использовании dbt в связке с Airflow?

Работа с Greenplum и ClickHouse требует понимания различий в хранении.

В каких сценариях вы выберете ClickHouse вместо Greenplum для хранения данных и почему?

Похожие вакансии

NDA
Не указана

Middle+ Data Engineer

MiddleУдалённо
Databricks · Unity Catalog · Delta Lake · Terraform · Python · Spark · PySpark · SQL · Infrastructure as Code · AWS · GCP
+11 навыков
О«
ООО «Образовательные продукты Русяева»
180 000 ₽ – 250 000 ₽

Backend / ML Infrastructure / MLOps инженер

MiddleУдалённо
Python · TypeScript · PostgreSQL · Qdrant · RAG · LLM · S3 · Sentry · MLOps · Vector Search
+10 навыков
X
X5
Не указана

Data Engineer Middle

MiddleУдалённо
SQL · PostgreSQL · Oracle · MySQL · Microsoft SQL Server · DB2 · Amazon S3 · Trino · ClickHouse · Greenplum · Apache Hive · Git · dbt · Cosmos · Apache Iceberg · Python
+16 навыков
O
Ozon
Не указана

Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы

MiddleУдалённо
Python · NLP · LLM · Machine Learning · Data Science
+5 навыков
E
Ekleft
Не указана

Специалист по науке о данных прогнозирования

MiddleУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Machine Learning · Data Analysis · Feature Engineering · Spark MLlib · Pandas
+12 навыков
A
Aston
Не указана

ML Engineer

MiddleУдалённо
Apache Kafka · REST · JSON · HTTP · WebSockets · RESTful API · LangGraph · Git · Docker
+9 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

N
NDA
Россия