Откликайтесь
на вакансии с ИИ

Middle Data Engineer
Отличное предложение для Middle-специалиста: удаленный формат по всему миру, современный стек технологий и четкие требования. Небольшой минус — отсутствие указания вилки зарплаты в тексте.
Сложность вакансии
Позиция требует уверенного владения широким стеком технологий (Spark, Airflow, Cloud) и более 3 лет опыта. Высокий порог входа обусловлен необходимостью работы с распределенными системами и строгими требованиями к уровню английского языка.
Анализ зарплаты
Для роли Middle Data Engineer с опытом от 3 лет и знанием английского B2, рыночная вилка обычно составляет $3500–$5500. Данная позиция соответствует мировым стандартам для удаленной работы в аутсорс-моделях.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас
Отправьте свое резюме @yaroslav_rr и станьте ключевым звеном в создании масштабируемых систем данных!
Описание вакансии
#lookfor #outsource #outstaff #remote #DataEngineer #Python #SQL #PySpark #ETL #DataWarehouse #BigData #AWS #Azure
We are looking for a Middle Data Engineer to join our data team on a full-time remote basis.
The specialist will design, build, and maintain scalable data pipelines and ETL/ELT processes, working with large-scale datasets, data warehouses, and cloud platforms.
Key responsibilities:
• Design, develop, and maintain ETL/ELT pipelines for data ingestion, transformation, and loading.
• Build and optimize data processing workflows using Python and PySpark.
• Develop data warehouse architectures and data lake solutions.
• Create and maintain SQL queries, stored procedures, and data models for reporting.
• Integrate data from APIs, databases, streaming services, and third-party platforms.
• Implement data quality checks, validation rules, and monitoring mechanisms.
• Orchestrate workflows using Apache Airflow, Dagster, or similar tools.
• Collaborate with data scientists and analysts to deliver clean, reliable datasets.
• Document data architectures, pipeline logic, and data dictionaries.
Requirements:
• 3+ years of commercial experience in data engineering or related roles.
• Strong proficiency in Python for data processing and automation.
• Expert-level SQL skills including complex queries, window functions, and query optimization.
• Hands-on experience with Apache Spark and PySpark for distributed data processing.
• Solid understanding of ETL/ELT concepts and data pipeline design patterns.
• Experience with relational databases, data warehouses (Snowflake, BigQuery, Redshift), and data lakes (Delta Lake, Iceberg).
• Experience with cloud platforms (AWS, Azure, or GCP) and their data services.
• Understanding of data modeling: star schema, snowflake schema, normalization, denormalization.
• Experience with workflow orchestration tools (Airflow, Prefect, Dagster).
• Familiarity with streaming data processing (Kafka, Kinesis, Spark Streaming).
• Knowledge of Git, data governance, security, and compliance principles.
• Strong analytical and problem-solving skills with attention to data accuracy.
• English: B2 or higher (written and spoken).
Nice to have:
• Experience with infrastructure-as-code (Terraform), dbt, and CI/CD for data pipelines.
• Familiarity with NoSQL databases, BI tools, or real-time analytics frameworks.
• Understanding of MLOps concepts and machine learning pipelines.
• Contributions to open-source data engineering projects.
Location: Remote, worldwide
Restrictions: Candidates from Egypt, India, Pakistan, and Afghanistan are not considered
English: B2+
Format: Full-time, outsource, outstaff
Contact: Откликнуться
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- SQL
- PySpark
- ETL
- Data Warehouse
- BigData
- AWS
- Azure
- Apache Spark
- Snowflake
- Google Cloud Platform
- Delta Lake
- Apache Iceberg
- Apache Airflow
- Dagster
- Kafka
- Git
- Terraform
- dbt
Возможные вопросы на собеседовании
Проверка понимания архитектурных паттернов и умения выбирать между ETL и ELT в зависимости от задачи.
В каких случаях вы бы предпочли архитектуру ELT вместо традиционного ETL, и как это влияет на выбор инструментов (например, Snowflake vs Spark)?
Оценка навыков оптимизации производительности в распределенных системах.
Как вы боретесь с проблемой 'data skew' (перекоса данных) при выполнении join-операций в PySpark?
Проверка практического опыта работы с оркестраторами.
Опишите ваш опыт настройки зависимостей и обработки сбоев в Apache Airflow. Как вы обеспечиваете идемпотентность ваших DAG?
Оценка навыков проектирования хранилищ данных.
Какие преимущества и недостатки у схемы 'звезда' по сравнению с нормализованными формами в контексте современных облачных хранилищ?
Проверка навыков работы с потоковыми данными.
Как обеспечить семантику 'exactly-once' при интеграции данных из Kafka в хранилище?
Похожие вакансии
Middle+ Data Engineer
Backend / ML Infrastructure / MLOps инженер
Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы
Специалист по науке о данных прогнозирования
ML Engineer
Backend / ML Infrastructure / MLOps инженер (ИИ-ассистент)
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!