+500% приглашений

Откликайтесь
на вакансии с ИИ

MiddleУдалённоПолная занятость

Middle Data Engineer

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Отличное предложение для Middle-специалиста: удаленный формат по всему миру, современный стек технологий и четкие требования. Небольшой минус — отсутствие указания вилки зарплаты в тексте.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Позиция требует уверенного владения широким стеком технологий (Spark, Airflow, Cloud) и более 3 лет опыта. Высокий порог входа обусловлен необходимостью работы с распределенными системами и строгими требованиями к уровню английского языка.

Анализ зарплаты

Медиана4 500 $

Рынок3 500 $ – 5 500 $

Для роли Middle Data Engineer с опытом от 3 лет и знанием английского B2, рыночная вилка обычно составляет $3500–$5500. Данная позиция соответствует мировым стандартам для удаленной работы в аутсорс-моделях.

I am writing to express my interest in the Middle Data Engineer position. With over 3 years of experience in building scalable ETL/ELT pipelines and a strong command of Python, SQL, and PySpark, I am confident in my ability to contribute effectively to your data team. My background includes extensive work with cloud platforms like AWS and Azure, as well as orchestrating complex workflows using Apache Airflow.

In my previous roles, I have successfully designed data warehouse architectures and integrated diverse data sources, ensuring high data quality and reliability. I am particularly drawn to this opportunity because of the focus on distributed data processing and modern stack components like Snowflake and Delta Lake. My B2+ English proficiency allows me to collaborate seamlessly in international environments and document technical architectures clearly.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Отправьте свое резюме @yaroslav_rr и станьте ключевым звеном в создании масштабируемых систем данных!

Описание вакансии

#lookfor #outsource #outstaff #remote #DataEngineer #Python #SQL #PySpark #ETL #DataWarehouse #BigData #AWS #Azure

We are looking for a Middle Data Engineer to join our data team on a full-time remote basis.

The specialist will design, build, and maintain scalable data pipelines and ETL/ELT processes, working with large-scale datasets, data warehouses, and cloud platforms.

Key responsibilities:

• Design, develop, and maintain ETL/ELT pipelines for data ingestion, transformation, and loading.

• Build and optimize data processing workflows using Python and PySpark.

• Develop data warehouse architectures and data lake solutions.

• Create and maintain SQL queries, stored procedures, and data models for reporting.

• Integrate data from APIs, databases, streaming services, and third-party platforms.

• Implement data quality checks, validation rules, and monitoring mechanisms.

• Orchestrate workflows using Apache Airflow, Dagster, or similar tools.

• Collaborate with data scientists and analysts to deliver clean, reliable datasets.

• Document data architectures, pipeline logic, and data dictionaries.

Requirements:

• 3+ years of commercial experience in data engineering or related roles.

• Strong proficiency in Python for data processing and automation.

• Expert-level SQL skills including complex queries, window functions, and query optimization.

• Hands-on experience with Apache Spark and PySpark for distributed data processing.

• Solid understanding of ETL/ELT concepts and data pipeline design patterns.

• Experience with relational databases, data warehouses (Snowflake, BigQuery, Redshift), and data lakes (Delta Lake, Iceberg).

• Experience with cloud platforms (AWS, Azure, or GCP) and their data services.

• Understanding of data modeling: star schema, snowflake schema, normalization, denormalization.

• Experience with workflow orchestration tools (Airflow, Prefect, Dagster).

• Familiarity with streaming data processing (Kafka, Kinesis, Spark Streaming).

• Knowledge of Git, data governance, security, and compliance principles.

• Strong analytical and problem-solving skills with attention to data accuracy.

• English: B2 or higher (written and spoken).

Nice to have:

• Experience with infrastructure-as-code (Terraform), dbt, and CI/CD for data pipelines.

• Familiarity with NoSQL databases, BI tools, or real-time analytics frameworks.

• Understanding of MLOps concepts and machine learning pipelines.

• Contributions to open-source data engineering projects.

Location: Remote, worldwide

Restrictions: Candidates from Egypt, India, Pakistan, and Afghanistan are not considered

English: B2+

Format: Full-time, outsource, outstaff

Contact: Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
SQL
PySpark
ETL
Data Warehouse
BigData
AWS
Azure
Apache Spark
Snowflake
Google Cloud Platform
Delta Lake
Apache Iceberg
Apache Airflow
Dagster
Kafka
Git
Terraform
dbt

Возможные вопросы на собеседовании

Проверка понимания архитектурных паттернов и умения выбирать между ETL и ELT в зависимости от задачи.

В каких случаях вы бы предпочли архитектуру ELT вместо традиционного ETL, и как это влияет на выбор инструментов (например, Snowflake vs Spark)?

Оценка навыков оптимизации производительности в распределенных системах.

Как вы боретесь с проблемой 'data skew' (перекоса данных) при выполнении join-операций в PySpark?

Проверка практического опыта работы с оркестраторами.

Опишите ваш опыт настройки зависимостей и обработки сбоев в Apache Airflow. Как вы обеспечиваете идемпотентность ваших DAG?

Оценка навыков проектирования хранилищ данных.

Какие преимущества и недостатки у схемы 'звезда' по сравнению с нормализованными формами в контексте современных облачных хранилищ?

Проверка навыков работы с потоковыми данными.

Как обеспечить семантику 'exactly-once' при интеграции данных из Kafka в хранилище?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!