- Зарплата
- 240 000 ₽ – 350 000 ₽
Откликайтесь
на вакансии с ИИ

Data Engineer
Привлекательная вакансия для опытных инженеров благодаря современному стеку технологий и возможности удаленной работы из любой точки мира. Уровень оплаты труда соответствует рыночному для грейда Middle+, а четко прописанные задачи позволяют сразу оценить масштаб ответственности.
Сложность вакансии
Высокая сложность обусловлена требованиями к глубокому знанию специфического стека (Databricks, Unity Catalog, Terraform) и опытом работы с облачными платформами (GCP/AWS). От кандидата ожидается не просто написание кода, но и проектирование архитектуры доступа и контрактов данных.
Анализ зарплаты
Предлагаемая вилка 240 000 – 350 000 рублей полностью соответствует рыночным ожиданиям для позиции Middle+ Data Engineer в России и СНГ. Верхняя граница в 350к является конкурентной для специалистов с глубоким знанием Databricks и Terraform.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в LIAN уже сейчас
Если вы эксперт в Databricks и Terraform, отправьте свое резюме @yanggilla прямо сейчас!
Описание вакансии
Вакансия: Data Engineer
Аутстафф проект
Компания: ЛИАН
Занятость: фулл тайм
Локация: весь мир
ЗП: от 240 до 350 тыс
Оформление: ИП (по СЗ при совместительстве)
Грейд: middle+ и выше
Чем предстоит заниматься:
1) Проектировать, внедрять и сопровождать пайплайны обработки информации и системы управления данными, построенные на платформе Databricks (с использованием Unity Catalog, Delta Lake и Workflows).
2) Проводить детальное исследование, профилирование и очистку наборов данных с целью их распределения по бизнес-доменам и выявления сведений, относящихся к персональным данным (PII).
3) Участвовать в создании архитектуры разграничения доступа к данным, уделяя внимание договорённостям о структуре данных (data contracts), управлению правами в каталоге, а также автоматизированному предоставлению и отзыву привилегий через подход «инфраструктура как код» на базе Terraform.
4) Взаимодействовать с командой для рецензирования и подтверждения того, что разработанные схемы доступа и контракты данных являются производительными, адаптируемыми и пригодными для многократного применения.
5) Обеспечивать корректный запуск продуктов обработки данных и механизмов контроля доступа в строгом соответствии с утверждёнными контрактами, исключая любые нежелательные побочные эффекты.
6) Готовить и актуализировать развёрнутую документацию, охватывающую контракты на данные, модели доступа и общие регламенты управления информационными активами.
7) Отслеживать работу развёрнутых пайплайнов и выполнять проверки качества данных, чтобы гарантировать их соответствие заданным показателям надёжности, скорости и точности.
8) Активно изучать существующие внутренние наработки и искать готовые решения, способствующие повторному использованию компонентов и унификации подходов в рамках общей платформы данных.
Наши пожелания к кандидатам:
1) Более 3 лет опыта работы в области проектирования данных;
2) Опыт работы с Python и широко используемых фреймворков для обработки данных (например, Spark/PySpark для потоковой, пакетной и асинхронной обработки данных);
3) Практический опыт работы с Unity Catalog и Delta Lake;
4) Опыт автоматизации развертывания объектов Databricks через Terraform (создание кластеров, заданий, секретов, управления доступом — не только инфраструктура, но и конфигурация сервисов);
5) Умение оптимизировать производительность Spark-задач (настройка партицирования, кэширования, выбор форматов, борьба с перекосом данных);
6) Опыт работы с потоковой обработкой (структурированный стриминг Spark, обработка событий);
7) Глубокие фундаментальные знания в области моделирования данных, распределенной обработки данных, SQL и архитектуры хранилищ/озерных баз данных;
8) Обязательным требованием является практический опыт развертывания облачных платформ и инфраструктуры данных (Databricks, GCP или AWS) с использованием Terraform, а также готовность к изучению новых технологий для целей интеграции;
9) Опыт внедрения CI/CD для кода обработки данных (автоматические тесты, линтинг, развертывание через Git-репозитории, интеграция с Jenkins/GitLab CI).
10) Способность проектировать решения для доступа к данным и управления данными, используя устоявшиеся шаблоны проектирования и различные инструменты проектирования;
11) Четкое понимание бизнес-ценности предоставляемых продуктов данных и механизмов управления;
12) Опыт разработки программного обеспечения.
13) Английский от B1
Для отклика писать в личные сообщения Откликнуться
Прикрепляйте сразу CV
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- Python
- Spark
- PySpark
- Databricks
- Unity Catalog
- Delta Lake
- Terraform
- SQL
- GCP
- AWS
- CI/CD
- Jenkins
- GitLab CI
Возможные вопросы на собеседовании
Вакансия предполагает активное использование Terraform для настройки сервисов Databricks.
Расскажите о вашем опыте автоматизации Databricks через Terraform: какие ресурсы вы создавали и с какими сложностями при управлении правами доступа сталкивались?
Оптимизация Spark-задач указана как важное требование.
Как вы подходите к диагностике и устранению перекоса данных (data skew) в Spark-приложениях?
Проект использует Unity Catalog для управления данными.
Каковы основные преимущества использования Unity Catalog по сравнению с традиционным Hive Metastore в контексте безопасности и управления метаданными?
В задачах упоминается работа с Data Contracts.
Как, по вашему мнению, внедрение контрактов данных влияет на стабильность пайплайнов и взаимодействие между командами-поставщиками и потребителями данных?
Требуется опыт работы с Delta Lake.
В чем заключаются ключевые особенности формата Delta Lake, и как механизмы Time Travel или Vacuum помогают в администрировании хранилища?
Похожие вакансии
Data инженер (Middle)
Backend / ML Infrastructure / MLOps инженер
Middle+ Data Engineer
Data Engineer Middle
Data Scientist (Модели оценки качества), Диалоговый ИИ и ML сервисы
Специалист по науке о данных прогнозирования
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!