yandex
В
ВТБ
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
УдалённоПолная занятость

Spark Developer (Scala / Data Lake VTB)

Оценка ИИ

Интересная вакансия в крупном финтех-проекте (ВТБ) с современным стеком технологий и возможностью удаленной работы. Проект предполагает работу с действительно большими данными, что является отличным кейсом для профессионального роста Spark-разработчика.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Позиция требует глубоких знаний Scala и Apache Spark, а также опыта работы с экосистемой Hadoop и сложными ETL-процессами в рамках Data Lake. Высокая сложность обусловлена необходимостью оптимизации приложений под высокие нагрузки и интеграции с множеством различных СУБД.

Анализ зарплаты

Медиана350 000 ₽
Рынок250 000 ₽ – 450 000 ₽
Оценка ИИ

Указанная роль Spark-разработчика в банковском секторе обычно оплачивается выше среднего по рынку из-за высоких требований к надежности и масштабируемости систем. Рыночные вилки для Senior/Middle+ специалистов в этой области в РФ составляют от 250 000 до 450 000 рублей.

Сопроводительное письмо

Меня заинтересовала вакансия Spark Developer в проекте Data Lake ВТБ, так как мой опыт разработки распределенных систем на Scala и оптимизации Spark-приложений полностью соответствует вашим требованиям. Я имею глубокую экспертизу в построении ETL-процессов и работе с экосистемой Hadoop, что позволит мне эффективно включиться в развитие вашего хранилища данных.

В своей практике я уделяю особое внимание производительности Spark DataFrame API и интеграции с различными СУБД, включая Oracle и PostgreSQL. Уверен, что мои навыки работы с высоконагруженными кластерами и понимание архитектуры Data Lake принесут значительную пользу вашей команде в реализации сложных аналитических задач.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в ВТБ уже сейчас

Отправьте свое резюме в Telegram, чтобы стать частью команды Data Lake ВТБ и работать над масштабными проектами обработки данных!

Описание вакансии

Spark Developer (Scala / Data Lake VTB)

#SparkDeveloper #Удаленно #РФ #Developer

Требования:

Стек: Scala, Apache Spark, SQL, Hadoop, Hive, CI/CD. Разрабатывать сложные распределённые процессы обработки данных на Scala. Строить эффективные пайплайны на Spark DataFrame API. Заниматься оптимизацией Spark-приложений для работы под высокой нагрузкой. Реализовывать ETL-процессы, интегрируясь с Oracle, Postgres, MS SQL и другими БД. Взаимодействовать со смежными командами в рамках развития Data Lake. Уверенное владение Scala и Apache Spark. Понимание принципов построения DWH и Data Lake. Отличный SQL и опыт работы с различными СУБД. Навыки работы с Hadoop, Hive и инструментами CI/CD. Будет плюсом: Опыт с действительно большими кластерами данных.

Локация:📍Удалённо, РФ.

Контакт для отклика: Откликнуться ID: Spark_DNA

Про карьеру, рост и ценность себя: @jobstobeloved

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Scala
  • Apache Spark
  • SQL
  • Hadoop
  • Hive
  • CI/CD
  • ETL
  • Oracle
  • PostgreSQL
  • Microsoft SQL Server
  • Data Lake
  • Data Warehouse

Возможные вопросы на собеседовании

Проверка понимания внутреннего устройства Spark для оптимизации производительности.

Расскажите о различиях между Narrow и Wide transformations в Spark и как они влияют на shuffle-операции?

Оценка навыков написания эффективного кода на Scala в контексте обработки данных.

Какие преимущества дает использование Dataset API по сравнению с DataFrame API в Scala, и в каких случаях вы отдадите предпочтение DataFrame?

Проверка опыта работы с распределенными файловыми системами и форматами хранения.

Как бы вы оптимизировали чтение данных из Hive, если таблица содержит миллиарды строк и сотни партиций?

Оценка архитектурного мышления в области больших данных.

С какими основными проблемами вы сталкивались при интеграции Spark с реляционными БД (Oracle/Postgres) и как их решали?

Проверка практического опыта отладки.

Как вы будете диагностировать и устранять проблему 'Data Skew' в Spark-приложении?

Похожие вакансии

NDA
2 000 ₽ – 2 500 ₽

ML разработчик (Senior)

SeniorУдалённоРоссия
n8n · Generative AI · Python · JavaScript · TypeScript · React · LangChain · PostgreSQL · REST · GraphQL · FastAPI · RAG · Vector Database · Prompt Engineering
+14 навыков
NDA
161 493 ₽ – 284 963 ₽

Data инженер (Senior)

SeniorУдалённоРоссия
Airflow · Trino · Greenplum · Git · S3 · ClickHouse · Python · Spark · Data Vault
+9 навыков
NDA
64 529 ₽ – 122 400 ₽

Data Engineer Python (Middle)

MiddleУдалённоРоссия
Python · OOP · Git · SQL · REST · SOAP · JSON · XML · API
+9 навыков
J
JETLYN
330 000 ₽ – 440 000 ₽

MLOps Engineer

SeniorУдалённоРоссия
Kubernetes · Docker · Helm · Jenkins · GitLab CI · Python · Airflow · JupyterHub · MLflow · Seldon · CUDA · Hadoop · Apache Spark · Apache Kafka · ELK stack · LLMOps · RAG · AutoML
+18 навыков
NDA
173 416 ₽ – 306 000 ₽

Инженер Mlops (Senior)

SeniorУдалённоРоссия
MLOps · Kubernetes · Docker · Helm · Jenkins · GitLab CI · Python · Airflow · JupyterHub · MLflow · Seldon · CUDA · Hadoop · Apache Spark · Apache Kafka · ELK stack · RAG · LLMOps · AutoML · Computer Vision
+20 навыков
OS
Omega Solutions
316 000 ₽ – 368 000 ₽

Middle+ ML разработчик

MiddleУдалённоРоссия
Python · MLOps · PySpark · SQL · PyTorch · TensorFlow · Docker · Kubernetes · FastAPI · MLflow · Airflow · DVC · GitLab CI · Scikit-learn · Pandas · NumPy
+16 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

В
ВТБ
Страна
Россия