yandex
N
NDA
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
MiddleУдалённоПолная занятость

Middle Data Engineer

ИИОценка ИИ

Отличное предложение для Middle-специалиста: удаленный формат по всему миру, современный стек технологий и четкие требования. Небольшой минус — отсутствие указания вилки зарплаты в тексте.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Позиция требует уверенного владения широким стеком технологий (Spark, Airflow, Cloud) и более 3 лет опыта. Высокий порог входа обусловлен необходимостью работы с распределенными системами и строгими требованиями к уровню английского языка.

Анализ зарплаты

Медиана4 500 $
Рынок3 500 $ – 5 500 $
ИИОценка ИИ

Для роли Middle Data Engineer с опытом от 3 лет и знанием английского B2, рыночная вилка обычно составляет $3500–$5500. Данная позиция соответствует мировым стандартам для удаленной работы в аутсорс-моделях.

Сопроводительное письмо

I am writing to express my interest in the Middle Data Engineer position. With over 3 years of experience in building scalable ETL/ELT pipelines and a strong command of Python, SQL, and PySpark, I am confident in my ability to contribute effectively to your data team. My background includes extensive work with cloud platforms like AWS and Azure, as well as orchestrating complex workflows using Apache Airflow.

In my previous roles, I have successfully designed data warehouse architectures and integrated diverse data sources, ensuring high data quality and reliability. I am particularly drawn to this opportunity because of the focus on distributed data processing and modern stack components like Snowflake and Delta Lake. My B2+ English proficiency allows me to collaborate seamlessly in international environments and document technical architectures clearly.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь уже сейчас

Отправьте свое резюме @yaroslav_rr и станьте ключевым звеном в создании масштабируемых систем данных!

Описание вакансии

#lookfor #outsource #outstaff #remote #DataEngineer #Python #SQL #PySpark #ETL #DataWarehouse #BigData #AWS #Azure

We are looking for a Middle Data Engineer to join our data team on a full-time remote basis.

The specialist will design, build, and maintain scalable data pipelines and ETL/ELT processes, working with large-scale datasets, data warehouses, and cloud platforms.

Key responsibilities:

• Design, develop, and maintain ETL/ELT pipelines for data ingestion, transformation, and loading.

• Build and optimize data processing workflows using Python and PySpark.

• Develop data warehouse architectures and data lake solutions.

• Create and maintain SQL queries, stored procedures, and data models for reporting.

• Integrate data from APIs, databases, streaming services, and third-party platforms.

• Implement data quality checks, validation rules, and monitoring mechanisms.

• Orchestrate workflows using Apache Airflow, Dagster, or similar tools.

• Collaborate with data scientists and analysts to deliver clean, reliable datasets.

• Document data architectures, pipeline logic, and data dictionaries.

Requirements:

• 3+ years of commercial experience in data engineering or related roles.

• Strong proficiency in Python for data processing and automation.

• Expert-level SQL skills including complex queries, window functions, and query optimization.

• Hands-on experience with Apache Spark and PySpark for distributed data processing.

• Solid understanding of ETL/ELT concepts and data pipeline design patterns.

• Experience with relational databases, data warehouses (Snowflake, BigQuery, Redshift), and data lakes (Delta Lake, Iceberg).

• Experience with cloud platforms (AWS, Azure, or GCP) and their data services.

• Understanding of data modeling: star schema, snowflake schema, normalization, denormalization.

• Experience with workflow orchestration tools (Airflow, Prefect, Dagster).

• Familiarity with streaming data processing (Kafka, Kinesis, Spark Streaming).

• Knowledge of Git, data governance, security, and compliance principles.

• Strong analytical and problem-solving skills with attention to data accuracy.

• English: B2 or higher (written and spoken).

Nice to have:

• Experience with infrastructure-as-code (Terraform), dbt, and CI/CD for data pipelines.

• Familiarity with NoSQL databases, BI tools, or real-time analytics frameworks.

• Understanding of MLOps concepts and machine learning pipelines.

• Contributions to open-source data engineering projects.

Location: Remote, worldwide

Restrictions: Candidates from Egypt, India, Pakistan, and Afghanistan are not considered

English: B2+

Format: Full-time, outsource, outstaff

Contact: Откликнуться

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • SQL
  • PySpark
  • ETL
  • Data Warehouse
  • BigData
  • AWS
  • Azure
  • Apache Spark
  • Snowflake
  • Google Cloud Platform
  • Delta Lake
  • Apache Iceberg
  • Apache Airflow
  • Dagster
  • Kafka
  • Git
  • Terraform
  • dbt

Возможные вопросы на собеседовании

Проверка понимания архитектурных паттернов и умения выбирать между ETL и ELT в зависимости от задачи.

В каких случаях вы бы предпочли архитектуру ELT вместо традиционного ETL, и как это влияет на выбор инструментов (например, Snowflake vs Spark)?

Оценка навыков оптимизации производительности в распределенных системах.

Как вы боретесь с проблемой 'data skew' (перекоса данных) при выполнении join-операций в PySpark?

Проверка практического опыта работы с оркестраторами.

Опишите ваш опыт настройки зависимостей и обработки сбоев в Apache Airflow. Как вы обеспечиваете идемпотентность ваших DAG?

Оценка навыков проектирования хранилищ данных.

Какие преимущества и недостатки у схемы 'звезда' по сравнению с нормализованными формами в контексте современных облачных хранилищ?

Проверка навыков работы с потоковыми данными.

Как обеспечить семантику 'exactly-once' при интеграции данных из Kafka в хранилище?

Похожие вакансии

NDA
Не указана

Middle+ Data Engineer

MiddleУдалённо
Databricks · Unity Catalog · Delta Lake · Terraform · Python · Spark · PySpark · SQL · Infrastructure as Code · AWS · GCP
+11 навыков
О«
ООО «Образовательные продукты Русяева»
180 000 ₽ – 250 000 ₽

Backend / ML Infrastructure / MLOps инженер

MiddleУдалённо
Python · TypeScript · PostgreSQL · Qdrant · RAG · LLM · S3 · Sentry · MLOps · Vector Search
+10 навыков
O
Ozon
Не указана

Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы

MiddleУдалённо
Python · NLP · LLM · Machine Learning · Data Science
+5 навыков
E
Ekleft
Не указана

Специалист по науке о данных прогнозирования

MiddleУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Machine Learning · Data Analysis · Feature Engineering · Spark MLlib · Pandas
+12 навыков
A
Aston
Не указана

ML Engineer

MiddleУдалённо
Apache Kafka · REST · JSON · HTTP · WebSockets · RESTful API · LangGraph · Git · Docker
+9 навыков
О«
ООО «Образовательные продукты Русяева»
180 000 ₽ – 250 000 ₽

Backend / ML Infrastructure / MLOps инженер (ИИ-ассистент)

MiddleУдалённо
Python · TypeScript · PostgreSQL · Qdrant · RAG · LLM · MLOps · S3 · Sentry · Vector Search
+10 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

N
NDA