Зарплата: 240 000 ₽ – 350 000 ₽

+500% приглашений

Откликайтесь
на вакансии с ИИ

MiddleУдалённоПолная занятость

Data Engineer

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

Привлекательная вакансия для опытных инженеров благодаря современному стеку технологий и возможности удаленной работы из любой точки мира. Уровень оплаты труда соответствует рыночному для грейда Middle+, а четко прописанные задачи позволяют сразу оценить масштаб ответственности.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Высокая сложность обусловлена требованиями к глубокому знанию специфического стека (Databricks, Unity Catalog, Terraform) и опытом работы с облачными платформами (GCP/AWS). От кандидата ожидается не просто написание кода, но и проектирование архитектуры доступа и контрактов данных.

Анализ зарплаты

Медиана300 000 ₽

Рынок250 000 ₽ – 400 000 ₽

Предлагаемая вилка 240 000 – 350 000 рублей полностью соответствует рыночным ожиданиям для позиции Middle+ Data Engineer в России и СНГ. Верхняя граница в 350к является конкурентной для специалистов с глубоким знанием Databricks и Terraform.

Меня заинтересовала вакансия Data Engineer в компании ЛИАН, так как мой опыт работы с экосистемой Databricks и инструментами автоматизации инфраструктуры полностью соответствует вашим задачам. Я обладаю глубокими знаниями PySpark, Delta Lake и имею практический опыт управления доступом через Unity Catalog. Особое внимание в своей работе я уделяю качеству данных и производительности Spark-задач, что критично для ваших пайплайнов.

В моем портфеле есть успешные кейсы внедрения подхода «инфраструктура как код» с использованием Terraform для развертывания облачных платформ (AWS/GCP). Я знаком с концепцией Data Contracts и умею выстраивать процессы CI/CD для обработки данных. Уверен, что мой технический бэкграунд и уровень английского позволят мне эффективно взаимодействовать с командой и приносить пользу проекту с первых дней.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в LIAN уже сейчас

Если вы эксперт в Databricks и Terraform, отправьте свое резюме @yanggilla прямо сейчас!

Описание вакансии

Вакансия: Data Engineer

Аутстафф проект

Компания: ЛИАН

Занятость: фулл тайм

Локация: весь мир

ЗП: от 240 до 350 тыс

Оформление: ИП (по СЗ при совместительстве)

Грейд: middle+ и выше

Чем предстоит заниматься:

1) Проектировать, внедрять и сопровождать пайплайны обработки информации и системы управления данными, построенные на платформе Databricks (с использованием Unity Catalog, Delta Lake и Workflows).

2) Проводить детальное исследование, профилирование и очистку наборов данных с целью их распределения по бизнес-доменам и выявления сведений, относящихся к персональным данным (PII).

3) Участвовать в создании архитектуры разграничения доступа к данным, уделяя внимание договорённостям о структуре данных (data contracts), управлению правами в каталоге, а также автоматизированному предоставлению и отзыву привилегий через подход «инфраструктура как код» на базе Terraform.

4) Взаимодействовать с командой для рецензирования и подтверждения того, что разработанные схемы доступа и контракты данных являются производительными, адаптируемыми и пригодными для многократного применения.

5) Обеспечивать корректный запуск продуктов обработки данных и механизмов контроля доступа в строгом соответствии с утверждёнными контрактами, исключая любые нежелательные побочные эффекты.

6) Готовить и актуализировать развёрнутую документацию, охватывающую контракты на данные, модели доступа и общие регламенты управления информационными активами.

7) Отслеживать работу развёрнутых пайплайнов и выполнять проверки качества данных, чтобы гарантировать их соответствие заданным показателям надёжности, скорости и точности.

8) Активно изучать существующие внутренние наработки и искать готовые решения, способствующие повторному использованию компонентов и унификации подходов в рамках общей платформы данных.

Наши пожелания к кандидатам:

1) Более 3 лет опыта работы в области проектирования данных;

2) Опыт работы с Python и широко используемых фреймворков для обработки данных (например, Spark/PySpark для потоковой, пакетной и асинхронной обработки данных);

3) Практический опыт работы с Unity Catalog и Delta Lake;

4) Опыт автоматизации развертывания объектов Databricks через Terraform (создание кластеров, заданий, секретов, управления доступом — не только инфраструктура, но и конфигурация сервисов);

5) Умение оптимизировать производительность Spark-задач (настройка партицирования, кэширования, выбор форматов, борьба с перекосом данных);

6) Опыт работы с потоковой обработкой (структурированный стриминг Spark, обработка событий);

7) Глубокие фундаментальные знания в области моделирования данных, распределенной обработки данных, SQL и архитектуры хранилищ/озерных баз данных;

8) Обязательным требованием является практический опыт развертывания облачных платформ и инфраструктуры данных (Databricks, GCP или AWS) с использованием Terraform, а также готовность к изучению новых технологий для целей интеграции;

9) Опыт внедрения CI/CD для кода обработки данных (автоматические тесты, линтинг, развертывание через Git-репозитории, интеграция с Jenkins/GitLab CI).

10) Способность проектировать решения для доступа к данным и управления данными, используя устоявшиеся шаблоны проектирования и различные инструменты проектирования;

11) Четкое понимание бизнес-ценности предоставляемых продуктов данных и механизмов управления;

12) Опыт разработки программного обеспечения.

13) Английский от B1

Для отклика писать в личные сообщения Откликнуться

Прикрепляйте сразу CV

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
Spark
PySpark
Databricks
Unity Catalog
Delta Lake
Terraform
SQL
GCP
AWS
CI/CD
Jenkins
GitLab CI

Возможные вопросы на собеседовании

Вакансия предполагает активное использование Terraform для настройки сервисов Databricks.

Расскажите о вашем опыте автоматизации Databricks через Terraform: какие ресурсы вы создавали и с какими сложностями при управлении правами доступа сталкивались?

Оптимизация Spark-задач указана как важное требование.

Как вы подходите к диагностике и устранению перекоса данных (data skew) в Spark-приложениях?

Проект использует Unity Catalog для управления данными.

Каковы основные преимущества использования Unity Catalog по сравнению с традиционным Hive Metastore в контексте безопасности и управления метаданными?

В задачах упоминается работа с Data Contracts.

Как, по вашему мнению, внедрение контрактов данных влияет на стабильность пайплайнов и взаимодействие между командами-поставщиками и потребителями данных?

Требуется опыт работы с Delta Lake.

В чем заключаются ключевые особенности формата Delta Lake, и как механизмы Time Travel или Vacuum помогают в администрировании хранилища?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

от 240 000 ₽

Откликайтесь
на вакансии с ИИ

Data Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в LIAN уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте автоматизации Databricks через Terraform: какие ресурсы вы создавали и с какими сложностями при управлении правами доступа сталкивались?

Как вы подходите к диагностике и устранению перекоса данных (data skew) в Spark-приложениях?

Каковы основные преимущества использования Unity Catalog по сравнению с традиционным Hive Metastore в контексте безопасности и управления метаданными?

Как, по вашему мнению, внедрение контрактов данных влияет на стабильность пайплайнов и взаимодействие между командами-поставщиками и потребителями данных?

В чем заключаются ключевые особенности формата Delta Lake, и как механизмы Time Travel или Vacuum помогают в администрировании хранилища?

Похожие вакансии

Data инженер (Middle)

Backend / ML Infrastructure / MLOps инженер

Middle+ Data Engineer

Data Engineer Middle

Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы

Специалист по науке о данных прогнозирования

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Data Engineer

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в LIAN уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите о вашем опыте автоматизации Databricks через Terraform: какие ресурсы вы создавали и с какими сложностями при управлении правами доступа сталкивались?

Как вы подходите к диагностике и устранению перекоса данных (data skew) в Spark-приложениях?

Каковы основные преимущества использования Unity Catalog по сравнению с традиционным Hive Metastore в контексте безопасности и управления метаданными?

Как, по вашему мнению, внедрение контрактов данных влияет на стабильность пайплайнов и взаимодействие между командами-поставщиками и потребителями данных?

В чем заключаются ключевые особенности формата Delta Lake, и как механизмы Time Travel или Vacuum помогают в администрировании хранилища?

Похожие вакансии

Data инженер (Middle)

Backend / ML Infrastructure / MLOps инженер

Middle+ Data Engineer

Data Engineer Middle

Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы

Специалист по науке о данных прогнозирования

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ