yandex
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
УдалённоПолная занятость

Инженер платформы данных (NRT/Spark)

Оценка ИИ

Вакансия в одной из топовых технологических компаний с сильной инженерной культурой и масштабными задачами. Предлагается работа над ключевыми продуктами экосистемы с отличным соцпакетом и возможностями роста.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
Оценка ИИ

Высокая сложность обусловлена требованиями к глубокому пониманию внутренней архитектуры Spark и опытом работы с высоконагруженными NRT-системами. Также необходим широкий стек технологий, включая различные СУБД и облачную инфраструктуру.

Анализ зарплаты

Медиана450 000 ₽
Рынок350 000 ₽ – 550 000 ₽
Оценка ИИ

Зарплата в объявлении не указана, но для позиции Senior Data Engineer в Яндексе рыночные ожидания составляют от 350 000 до 550 000 рублей в зависимости от уровня компетенций. Это соответствует или слегка превышает средние показатели по финтех-индустрии в России.

Сопроводительное письмо

Меня крайне заинтересовала вакансия инженера платформы данных в Финтехе Яндекса. Имея более четырех лет опыта в коммерческой разработке и глубокую экспертизу в работе с Apache Spark, я обладаю необходимыми навыками для оптимизации NRT-процессов и развития инфраструктуры обработки данных. Мой опыт работы с PostgreSQL, Greenplum и технологиями CDC позволит мне эффективно решать задачи по построению отказоустойчивых пайплайнов и систем мониторинга.

Я впечатлен масштабом продуктов Финтеха, таких как Яндекс Пэй и Сплит, и стремлюсь применить свои знания в области observability и проектирования облачных платформ для повышения производительности ваших сервисов. Уверен, что мой технический бэкграунд и понимание внутренней архитектуры Spark помогут команде в достижении амбициозных целей по развитию единой дата-платформы.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Яндекс уже сейчас

Присоединяйтесь к команде Финтеха Яндекса и создавайте будущее облачных дата-платформ уже сегодня!

Описание вакансии

❤️ Инженер платформы данных (NRT/Spark)

Финтех Яндекса — это одно из ключевых и наиболее динамично развивающихся направлений компании. Это экосистема финансовых сервисов, встроенная в повседневную жизнь миллионов пользователей и бизнесов. Ключевые продукты Финтеха: Яндекс Пэй, Сплит, Сейвы, Карта Плюса, кредитные продукты, Яндекс ID, Яндекс Про.

В команду платформенных данных ищем специалиста по Apache Spark с глубоким понимаем внутренней архитектуры фреймворка. Основные задачи — развитие платформы для обработки NRT-данных (near real time), повышение отказоустойчивости и производительности потоковых процессов.

Какие задачи вас ждут:

• Проектирование и развитие облачной дата-платформыОптимизировать инфраструктуру и проектировать новые компоненты платформы с использованием технологий Yandex Cloud.

• Построение единой observability-платформы для таблиц DWHСоздавать единую точку входа для мониторинга статусов сборки, качества данных и анализа зависимостей, включая построение datalineage и процессы логирования.

• Ускорение текущих процессов поставки данныхОптимизировать существующие и выстраивать новые надёжные процессы поставки данных, включая процессы взятия снепшотов, загрузки инкрементов напрямую, из аудит-таблиц и CDC, а также внедрять Spark Streaming или аналогичные решения для обеспечения обновления данных с минимальной задержкой.

• Построение тестовых окруженийСоздавать изолированные среды разработки, тестирования и предпрод с автоматизированными процессами проверки.

• Развитие фреймворков обработки данныхРазвивать внутренние фреймворки для загрузки, трансформации и контроля качества данных.

Мы ждём, что вы:• Занимались коммерческой разработкой от четырёх лет

• Понимаете устройство БД

• Владеете СУБД разного типа: PostgreSQL, Oracle, MongoDB, Greenplum

• Работали с CDC

• Уверенно работаете с S3-совместимыми хранилищами

Что мы предлагаем:Мы заботимся, чтобы вы были сыты, и компенсируем обеды. А на кофепойнтах всегда можно перекусить свежими фруктами. Это не все бонусы — полный список тут.

📩 Откликнуться на нашем сайте

#финтех #spark

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Apache Spark
  • Spark Streaming
  • PostgreSQL
  • Oracle
  • MongoDB
  • Greenplum
  • CDC
  • S3
  • Yandex Cloud
  • DWH
  • Observability
  • Data Lineage

Возможные вопросы на собеседовании

Вакансия требует глубокого понимания Spark для оптимизации производительности.

Расскажите о внутреннем устройстве Spark Catalyst Optimizer и о том, как вы оптимизировали планы выполнения запросов в своих проектах?

Одной из задач является внедрение Spark Streaming для минимизации задержек.

С какими основными проблемами вы сталкивались при обеспечении семантики 'exactly-once' в Spark Streaming и как их решали?

В задачах указано построение observability-платформы и datalineage.

Как бы вы спроектировали систему автоматического отслеживания зависимостей (data lineage) для сложного DWH с множеством источников?

Требуется опыт работы с CDC и различными СУБД.

Какие подходы к реализации CDC вы использовали для минимизации нагрузки на исходную БД (например, PostgreSQL или Oracle)?

Работа предполагает использование S3-хранилищ.

В чем заключаются особенности работы Spark с S3 (проблема консистентности, S3Guard) и как вы оптимизируете запись больших объемов данных в объектное хранилище?

Похожие вакансии

C
Centicore
300 000 ₽ – 350 000 ₽

Data Scientist (AutoML)

SeniorУдалённо
Python · PyTorch · LightGBM · XGBoost · CatBoost · Scikit-learn · Pandas · NumPy · Spark · Hadoop · Hive · MLflow · Airflow · Argo Workflows · AutoML · MLOps
+16 навыков
S
Selecty
350 000 ₽ – 450 000 ₽

Team Lead MLOps / Tech Lead

LeadУдалённо
MLOps · Kubernetes · CI/CD · Hadoop · Spark · Kafka · ELK stack · Jira · Feature Store · AutoML · RAG · DevOps
+12 навыков
I
IMS
1 500 ₽ – 2 000 ₽

Data Science / ML Engineer

Удалённо
Python · LLM · NLP · Qdrant · MemGraph · PostgreSQL · Redis · FastAPI · WebSocket · RAG · Vector Database · Neo4j · gRPC · OpenAPI
+14 навыков
NDA
от 1 700 ₽

Data инженер Middle+ Senior

SeniorУдалённо
SQL · DWH · ETL · ELT · Kubernetes · Git · Greenplum · Arenadata DB · Airflow
+9 навыков
NDA
от 1 700 ₽

Data инженер Middle

MiddleУдалённо
Java · Groovy · Docker · Rancher · SQL · PostgreSQL · Oracle · MySQL · Git · Apache NiFi · Airflow · Hadoop · HDFS · Hive · DWH · Data Lake · Ansible · Zabbix · Spark
+19 навыков
J
JETLYN
240 000 ₽ – 320 000 ₽

AI/ML Engineer

SeniorУдалённо
Python · FastAPI · LangChain · LlamaIndex · Qdrant · ChromaDB · Pinecone · vLLM · Ollama · Docker · Kubernetes · GPU · LLM · RAG · NLP · ASR · TTS · OCR · NER
+19 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Страна
Россия