yandex
L
LIAN
Зарплата
240 000 ₽ – 350 000 ₽
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
MiddleУдалённоПолная занятость

Data Engineer

ИИОценка ИИ

Привлекательная вакансия для опытных инженеров благодаря современному стеку технологий и возможности удаленной работы из любой точки мира. Уровень оплаты труда соответствует рыночному для грейда Middle+, а четко прописанные задачи позволяют сразу оценить масштаб ответственности.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Высокая сложность обусловлена требованиями к глубокому знанию специфического стека (Databricks, Unity Catalog, Terraform) и опытом работы с облачными платформами (GCP/AWS). От кандидата ожидается не просто написание кода, но и проектирование архитектуры доступа и контрактов данных.

Анализ зарплаты

Медиана300 000 ₽
Рынок250 000 ₽ – 400 000 ₽
ИИОценка ИИ

Предлагаемая вилка 240 000 – 350 000 рублей полностью соответствует рыночным ожиданиям для позиции Middle+ Data Engineer в России и СНГ. Верхняя граница в 350к является конкурентной для специалистов с глубоким знанием Databricks и Terraform.

Сопроводительное письмо

Меня заинтересовала вакансия Data Engineer в компании ЛИАН, так как мой опыт работы с экосистемой Databricks и инструментами автоматизации инфраструктуры полностью соответствует вашим задачам. Я обладаю глубокими знаниями PySpark, Delta Lake и имею практический опыт управления доступом через Unity Catalog. Особое внимание в своей работе я уделяю качеству данных и производительности Spark-задач, что критично для ваших пайплайнов.

В моем портфеле есть успешные кейсы внедрения подхода «инфраструктура как код» с использованием Terraform для развертывания облачных платформ (AWS/GCP). Я знаком с концепцией Data Contracts и умею выстраивать процессы CI/CD для обработки данных. Уверен, что мой технический бэкграунд и уровень английского позволят мне эффективно взаимодействовать с командой и приносить пользу проекту с первых дней.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в LIAN уже сейчас

Если вы эксперт в Databricks и Terraform, отправьте свое резюме @yanggilla прямо сейчас!

Описание вакансии

Вакансия: Data Engineer

Аутстафф проект

Компания: ЛИАН

Занятость: фулл тайм

Локация: весь мир

ЗП: от 240 до 350 тыс

Оформление: ИП (по СЗ при совместительстве)

Грейд: middle+ и выше

Чем предстоит заниматься:

1) Проектировать, внедрять и сопровождать пайплайны обработки информации и системы управления данными, построенные на платформе Databricks (с использованием Unity Catalog, Delta Lake и Workflows).

2) Проводить детальное исследование, профилирование и очистку наборов данных с целью их распределения по бизнес-доменам и выявления сведений, относящихся к персональным данным (PII).

3) Участвовать в создании архитектуры разграничения доступа к данным, уделяя внимание договорённостям о структуре данных (data contracts), управлению правами в каталоге, а также автоматизированному предоставлению и отзыву привилегий через подход «инфраструктура как код» на базе Terraform.

4) Взаимодействовать с командой для рецензирования и подтверждения того, что разработанные схемы доступа и контракты данных являются производительными, адаптируемыми и пригодными для многократного применения.

5) Обеспечивать корректный запуск продуктов обработки данных и механизмов контроля доступа в строгом соответствии с утверждёнными контрактами, исключая любые нежелательные побочные эффекты.

6) Готовить и актуализировать развёрнутую документацию, охватывающую контракты на данные, модели доступа и общие регламенты управления информационными активами.

7) Отслеживать работу развёрнутых пайплайнов и выполнять проверки качества данных, чтобы гарантировать их соответствие заданным показателям надёжности, скорости и точности.

8) Активно изучать существующие внутренние наработки и искать готовые решения, способствующие повторному использованию компонентов и унификации подходов в рамках общей платформы данных.

Наши пожелания к кандидатам:

1) Более 3 лет опыта работы в области проектирования данных;

2) Опыт работы с Python и широко используемых фреймворков для обработки данных (например, Spark/PySpark для потоковой, пакетной и асинхронной обработки данных);

3) Практический опыт работы с Unity Catalog и Delta Lake;

4) Опыт автоматизации развертывания объектов Databricks через Terraform (создание кластеров, заданий, секретов, управления доступом — не только инфраструктура, но и конфигурация сервисов);

5) Умение оптимизировать производительность Spark-задач (настройка партицирования, кэширования, выбор форматов, борьба с перекосом данных);

6) Опыт работы с потоковой обработкой (структурированный стриминг Spark, обработка событий);

7) Глубокие фундаментальные знания в области моделирования данных, распределенной обработки данных, SQL и архитектуры хранилищ/озерных баз данных;

8) Обязательным требованием является практический опыт развертывания облачных платформ и инфраструктуры данных (Databricks, GCP или AWS) с использованием Terraform, а также готовность к изучению новых технологий для целей интеграции;

9) Опыт внедрения CI/CD для кода обработки данных (автоматические тесты, линтинг, развертывание через Git-репозитории, интеграция с Jenkins/GitLab CI).

10) Способность проектировать решения для доступа к данным и управления данными, используя устоявшиеся шаблоны проектирования и различные инструменты проектирования;

11) Четкое понимание бизнес-ценности предоставляемых продуктов данных и механизмов управления;

12) Опыт разработки программного обеспечения.

13) Английский от B1

Для отклика писать в личные сообщения Откликнуться

Прикрепляйте сразу CV

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Python
  • Spark
  • PySpark
  • Databricks
  • Unity Catalog
  • Delta Lake
  • Terraform
  • SQL
  • GCP
  • AWS
  • CI/CD
  • Jenkins
  • GitLab CI

Возможные вопросы на собеседовании

Вакансия предполагает активное использование Terraform для настройки сервисов Databricks.

Расскажите о вашем опыте автоматизации Databricks через Terraform: какие ресурсы вы создавали и с какими сложностями при управлении правами доступа сталкивались?

Оптимизация Spark-задач указана как важное требование.

Как вы подходите к диагностике и устранению перекоса данных (data skew) в Spark-приложениях?

Проект использует Unity Catalog для управления данными.

Каковы основные преимущества использования Unity Catalog по сравнению с традиционным Hive Metastore в контексте безопасности и управления метаданными?

В задачах упоминается работа с Data Contracts.

Как, по вашему мнению, внедрение контрактов данных влияет на стабильность пайплайнов и взаимодействие между командами-поставщиками и потребителями данных?

Требуется опыт работы с Delta Lake.

В чем заключаются ключевые особенности формата Delta Lake, и как механизмы Time Travel или Vacuum помогают в администрировании хранилища?

Похожие вакансии

NDA
Не указана

Data инженер (Middle)

MiddleУдалённо
Greenplum · Trino · Apache Airflow · ClickHouse · Python · Spark · SQL · dbt · S3 · Hadoop · Iceberg · Kafka · Cosmos · Apache Flink · Java · PostgreSQL · Oracle · MySQL · Microsoft SQL Server · Git · Apache NiFi · Parquet · Avro · MinIO
+24 навыков
О«
ООО «Образовательные продукты Русяева»
180 000 ₽ – 250 000 ₽

Backend / ML Infrastructure / MLOps инженер

MiddleУдалённо
Python · TypeScript · PostgreSQL · Qdrant · RAG · LLM · S3 · Sentry · MLOps · Vector Search
+10 навыков
NDA
Не указана

Middle+ Data Engineer

MiddleУдалённо
Databricks · Unity Catalog · Delta Lake · Terraform · Python · Spark · PySpark · SQL · Infrastructure as Code · AWS · GCP
+11 навыков
X
X5
Не указана

Data Engineer Middle

MiddleУдалённо
SQL · PostgreSQL · Oracle · MySQL · Microsoft SQL Server · DB2 · Amazon S3 · Trino · ClickHouse · Greenplum · Apache Hive · Git · dbt · Cosmos · Apache Iceberg · Python
+16 навыков
O
Ozon
Не указана

Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы

MiddleУдалённо
Python · NLP · LLM · Machine Learning · Data Science
+5 навыков
E
Ekleft
Не указана

Специалист по науке о данных прогнозирования

MiddleУдалённо
Python · SQL · PySpark · ETL · Scikit-learn · TensorFlow · PyTorch · Machine Learning · Data Analysis · Feature Engineering · Spark MLlib · Pandas
+12 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

L
LIAN
от 240 000 ₽