yandex
Я
Яндекс
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
УдалённоПолная занятость

Инженер платформы данных (NRT/Spark)

ИИОценка ИИ

Вакансия в одной из топовых технологических компаний с сильной инженерной культурой и масштабными задачами. Предлагается работа над ключевыми продуктами экосистемы с отличным соцпакетом и возможностями роста.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Высокая сложность обусловлена требованиями к глубокому пониманию внутренней архитектуры Spark и опытом работы с высоконагруженными NRT-системами. Также необходим широкий стек технологий, включая различные СУБД и облачную инфраструктуру.

Анализ зарплаты

Медиана450 000 ₽
Рынок350 000 ₽ – 550 000 ₽
ИИОценка ИИ

Зарплата в объявлении не указана, но для позиции Senior Data Engineer в Яндексе рыночные ожидания составляют от 350 000 до 550 000 рублей в зависимости от уровня компетенций. Это соответствует или слегка превышает средние показатели по финтех-индустрии в России.

Сопроводительное письмо

Меня крайне заинтересовала вакансия инженера платформы данных в Финтехе Яндекса. Имея более четырех лет опыта в коммерческой разработке и глубокую экспертизу в работе с Apache Spark, я обладаю необходимыми навыками для оптимизации NRT-процессов и развития инфраструктуры обработки данных. Мой опыт работы с PostgreSQL, Greenplum и технологиями CDC позволит мне эффективно решать задачи по построению отказоустойчивых пайплайнов и систем мониторинга.

Я впечатлен масштабом продуктов Финтеха, таких как Яндекс Пэй и Сплит, и стремлюсь применить свои знания в области observability и проектирования облачных платформ для повышения производительности ваших сервисов. Уверен, что мой технический бэкграунд и понимание внутренней архитектуры Spark помогут команде в достижении амбициозных целей по развитию единой дата-платформы.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Яндекс уже сейчас

Присоединяйтесь к команде Финтеха Яндекса и создавайте будущее облачных дата-платформ уже сегодня!

Описание вакансии

❤️ Инженер платформы данных (NRT/Spark)

Финтех Яндекса — это одно из ключевых и наиболее динамично развивающихся направлений компании. Это экосистема финансовых сервисов, встроенная в повседневную жизнь миллионов пользователей и бизнесов. Ключевые продукты Финтеха: Яндекс Пэй, Сплит, Сейвы, Карта Плюса, кредитные продукты, Яндекс ID, Яндекс Про.

В команду платформенных данных ищем специалиста по Apache Spark с глубоким понимаем внутренней архитектуры фреймворка. Основные задачи — развитие платформы для обработки NRT-данных (near real time), повышение отказоустойчивости и производительности потоковых процессов.

Какие задачи вас ждут:

• Проектирование и развитие облачной дата-платформыОптимизировать инфраструктуру и проектировать новые компоненты платформы с использованием технологий Yandex Cloud.

• Построение единой observability-платформы для таблиц DWHСоздавать единую точку входа для мониторинга статусов сборки, качества данных и анализа зависимостей, включая построение datalineage и процессы логирования.

• Ускорение текущих процессов поставки данныхОптимизировать существующие и выстраивать новые надёжные процессы поставки данных, включая процессы взятия снепшотов, загрузки инкрементов напрямую, из аудит-таблиц и CDC, а также внедрять Spark Streaming или аналогичные решения для обеспечения обновления данных с минимальной задержкой.

• Построение тестовых окруженийСоздавать изолированные среды разработки, тестирования и предпрод с автоматизированными процессами проверки.

• Развитие фреймворков обработки данныхРазвивать внутренние фреймворки для загрузки, трансформации и контроля качества данных.

Мы ждём, что вы:• Занимались коммерческой разработкой от четырёх лет

• Понимаете устройство БД

• Владеете СУБД разного типа: PostgreSQL, Oracle, MongoDB, Greenplum

• Работали с CDC

• Уверенно работаете с S3-совместимыми хранилищами

Что мы предлагаем:Мы заботимся, чтобы вы были сыты, и компенсируем обеды. А на кофепойнтах всегда можно перекусить свежими фруктами. Это не все бонусы — полный список тут.

📩 Откликнуться на нашем сайте

#финтех #spark

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • PostgreSQL
  • Apache Spark
  • Observability
  • CDC
  • Oracle
  • MongoDB
  • S3
  • Data Lineage
  • Spark Streaming
  • DWH
  • Yandex Cloud
  • Greenplum

Возможные вопросы на собеседовании

Вакансия требует глубокого понимания Spark для оптимизации производительности.

Расскажите о внутреннем устройстве Spark Catalyst Optimizer и о том, как вы оптимизировали планы выполнения запросов в своих проектах?

Одной из задач является внедрение Spark Streaming для минимизации задержек.

С какими основными проблемами вы сталкивались при обеспечении семантики 'exactly-once' в Spark Streaming и как их решали?

В задачах указано построение observability-платформы и datalineage.

Как бы вы спроектировали систему автоматического отслеживания зависимостей (data lineage) для сложного DWH с множеством источников?

Требуется опыт работы с CDC и различными СУБД.

Какие подходы к реализации CDC вы использовали для минимизации нагрузки на исходную БД (например, PostgreSQL или Oracle)?

Работа предполагает использование S3-хранилищ.

В чем заключаются особенности работы Spark с S3 (проблема консистентности, S3Guard) и как вы оптимизируете запись больших объемов данных в объектное хранилище?

Похожие вакансии

NDA
2 000 ₽ – 2 500 ₽

ML разработчик (Senior)

SeniorУдалённо
n8n · Generative AI · Python · JavaScript · TypeScript · React · LangChain · PostgreSQL · REST · GraphQL · FastAPI · RAG · Vector Database · Prompt Engineering
+14 навыков
КС
КВИКЛИ СЕЧ ИТ
300 000 ₽ – 450 000 ₽

Senior / Middle+ Data Scientist

SeniorУдалённо
Python · Apache Spark · Machine Learning · Recommendation Systems · Ranking · NLP · LLM · MLOps · A/B Testing · Uplift Modeling
+10 навыков
S
Selecty
220 000 ₽ – 310 000 ₽

MlOps / Python Backend Engineer (ML)

SeniorУдалённо
Python · FastAPI · Flask · Kafka · Docker · Kubernetes · Airflow · Spark · Hive · SQL · MLOps · NLP · Computer Vision
+13 навыков
NDA
168 358 ₽ – 297 075 ₽

ML разработчик (Middle)

MiddleУдалённо
Python · Scikit-learn · Pandas · NumPy · PyTorch · TensorFlow · JAX · SQL · Spark · PySpark · Dask · Docker · Kubernetes · Git · DVC · GitLab CI · GitHub Actions · Jenkins · Prometheus · Grafana · Evidently AI · MLflow · AWS · GCP · Azure ML · Kubeflow · Airflow · FastAPI · Flask · Triton Inference Server · Feast · Tecton · Hopsworks · Horovod · Ray
+35 навыков
NDA
от 2 000 ₽

Data Scientist Senior

SeniorУдалённо
Python · Pandas · NumPy · Matplotlib · Seaborn · Plotly · Scikit-learn · SciPy · statsmodels · CatBoost · XGBoost · LightGBM · ARIMA · Prophet · Deep Learning · CNN · RNN · LSTM · Attention · Feature Engineering · tsfresh · EDA
+22 навыков
C
Centicore
340 000 ₽ – 360 000 ₽

Senior Data Scientist

SeniorУдалённо
Python · Machine Learning · Uplift Modeling · LightGBM · XGBoost · CatBoost · Scikit-learn · Pandas · NumPy · SQL · Apache Spark · Hadoop · Apache Hive · MLOps
+14 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Я
Яндекс
Россия