Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

MiddleУдалённоПолная занятость

Data инженер (Middle)

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Отличное предложение для Middle-специалиста с очень современным и востребованным стеком технологий (Lakehouse, Iceberg, Trino). Гибкость в локации и полная занятость делают вакансию привлекательной на текущем рынке.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует уверенного владения широким спектром инструментов Big Data (Spark, Airflow, Trino, Iceberg) и понимания архитектуры Lakehouse. Необходимость знания Java в дополнение к Python и SQL повышает порог входа для кандидатов уровня Middle.

Анализ зарплаты

Медиана320 000 ₽

Рынок250 000 ₽ – 400 000 ₽

Указанный стек технологий (Big Data) обычно оплачивается выше среднего по рынку РФ. Для уровня Middle в этой нише зарплаты часто начинаются от 250 000 рублей и могут достигать 400 000 рублей в зависимости от глубины знаний Spark и Java.

Меня заинтересовала вакансия Data инженера, так как мой опыт работы со стеком Greenplum, Airflow и Spark полностью соответствует вашим требованиям. Я обладаю глубокими знаниями SQL и Python, а также имею практический опыт построения интеграционных потоков и витрин данных в архитектуре Lakehouse.

Особенно меня привлекает возможность работы с такими инструментами, как Trino, Iceberg и dbt. Я уверен, что мои навыки оптимизации запросов и опыт поддержки документации помогут вашей команде эффективно развивать платформу больших данных. Буду рад обсудить, как мой опыт может быть полезен вашему проекту.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Отправьте свое резюме @ivanGr прямо сейчас, чтобы присоединиться к команде и работать с современным стеком Lakehouse!

Описание вакансии

#9455

Data инженер (Middle)

Локация: Любая

Гражданство: РФ/РБ

Загрузка: Full-time

Требования:

Стек: Greenplum, Trino, Apache Airflow, ClickHouse, Python, Spark, SQL (dbt), S3, Hadoop
Сбор требований с бизнес-заказчиков и анализ источников данных
Разработка, реализация и поддержка интеграционных потоков, а также потоков сборки витрин-данных на стеке: Trino, Iceberg, S3, Spark, Apache Airflow, Kafka, Cosmos, Flink
Оперативное реагирование на проблемы, выполнение типовых задач в срок
Поддержание документации типовых интеграционных решений платформы больших данных
Общее представление о стеке Lakehouse
Понимание различий между BigData/Lakehouse и обычными данными
Знание SQL (индексы, функции, оптимизация, профилирование)
Знание Java, Python
Опыт работы с реляционными БД (Oracle, Postgres, MySQL, MsSQL и т.п.)
Умение работать с Git (pull/commit/push)
Опыт работы с DBT, Cosmos, Ni-Fi
Опыт разработки на Spark
Понимание особенностей Trino
Понимание форматов данных Iceberg, Parquet, Avro
Понимание работы с minio или S3-хранилищами
Опыт использования системами ведения проектов и документации

Писать Откликнуться

Канал Аутстаф запросов Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Greenplum
Trino
Apache Airflow
ClickHouse
Python
Spark
SQL
dbt
S3
Hadoop
Iceberg
Kafka
Cosmos
Apache Flink
Java
PostgreSQL
Oracle
MySQL
Microsoft SQL Server
Git
Apache NiFi
Parquet
Avro
MinIO

Возможные вопросы на собеседовании

Вакансия предполагает работу с Lakehouse, поэтому важно понимать преимущества Iceberg перед классическими форматами.

В чем заключаются основные преимущества использования формата таблиц Iceberg в архитектуре Lakehouse по сравнению с обычным Parquet?

Trino указан как один из ключевых инструментов для обработки данных.

Расскажите об особенностях оптимизации запросов в Trino. Как работает механизм динамической фильтрации (Dynamic Filtering)?

Spark является основным инструментом обработки, важно знать нюансы его работы.

Как вы боретесь с проблемой перекоса данных (Data Skew) при выполнении Join-операций в Spark?

dbt и Cosmos используются для трансформации данных.

Каким образом вы организуете тестирование качества данных (Data Quality) при использовании dbt в связке с Airflow?

Работа с Greenplum и ClickHouse требует понимания различий в хранении.

В каких сценариях вы выберете ClickHouse вместо Greenplum для хранения данных и почему?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

Data инженер (Middle)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

В чем заключаются основные преимущества использования формата таблиц Iceberg в архитектуре Lakehouse по сравнению с обычным Parquet?

Расскажите об особенностях оптимизации запросов в Trino. Как работает механизм динамической фильтрации (Dynamic Filtering)?

Как вы боретесь с проблемой перекоса данных (Data Skew) при выполнении Join-операций в Spark?

Каким образом вы организуете тестирование качества данных (Data Quality) при использовании dbt в связке с Airflow?

В каких сценариях вы выберете ClickHouse вместо Greenplum для хранения данных и почему?

Похожие вакансии

Middle+ Data Engineer

Backend / ML Infrastructure / MLOps инженер

Data Engineer Middle

Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы

Специалист по науке о данных прогнозирования

ML Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Data инженер (Middle)

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

В чем заключаются основные преимущества использования формата таблиц Iceberg в архитектуре Lakehouse по сравнению с обычным Parquet?

Расскажите об особенностях оптимизации запросов в Trino. Как работает механизм динамической фильтрации (Dynamic Filtering)?

Как вы боретесь с проблемой перекоса данных (Data Skew) при выполнении Join-операций в Spark?

Каким образом вы организуете тестирование качества данных (Data Quality) при использовании dbt в связке с Airflow?

В каких сценариях вы выберете ClickHouse вместо Greenplum для хранения данных и почему?

Похожие вакансии

Middle+ Data Engineer

Backend / ML Infrastructure / MLOps инженер

Data Engineer Middle

Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы

Специалист по науке о данных прогнозирования

ML Engineer

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ