Страна: Россия

+500% приглашений

Откликайтесь
на вакансии с ИИ

LeadГибридПолная занятость

Ведущий инженер данных в VK Видео

Name: Quick Offer — сервис для поиска работы на hh.ru
Brand: Quick Offer
SKU: quick-offer-saas
Availability: InStock
Rating: 4.9 (682 reviews)

VK — один из крупнейших работодателей в РФ с сильной инженерной культурой и уникальными масштабами данных. Позиция предлагает работу с современным стеком (Spark, ClickHouse, YT) и гибридный формат работы в Москве.

Вакансия из Quick Offer Global, списка международных компаний

Пожаловаться

Сложность вакансии

ЛегкоСложно

Роль требует глубоких знаний распределенных систем (Hadoop, Spark) и умения работать с высоконагруженными хранилищами вроде ClickHouse. Статус 'Ведущего' подразумевает не только техническую экспертизу, но и навыки сбора требований и проведения код-ревью.

Анализ зарплаты

Медиана350 000 ₽

Рынок280 000 ₽ – 450 000 ₽

Зарплата в объявлении не указана, однако для позиции ведущего инженера данных в Москве в крупных тех-компаниях уровень компенсации обычно находится в верхнем сегменте рынка. Предложенный диапазон отражает текущие реалии для специалистов уровня Senior/Lead в BigData.

Меня заинтересовала вакансия ведущего инженера данных в VK Видео, так как я обладаю глубоким опытом работы с экосистемой Hadoop и Spark, а также успешно проектировал сложные ETL-процессы с использованием Airflow. Мой опыт включает не только разработку витрин данных, но и глубокую оптимизацию запросов в ClickHouse, что критично для высоконагруженных сервисов такого масштаба.

Я уверен, что мои навыки написания чистого Python-кода и понимание принципов параллельных вычислений позволят мне эффективно решать задачи по сбору требований и поддержке ML-команд. Буду рад обсудить, как мой опыт в разработке инфраструктуры данных поможет развитию VK Видео.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в vk уже сейчас

Присоединяйтесь к команде VK Видео и создавайте высоконагруженные системы обработки данных для миллионов пользователей!

Описание вакансии

Ведущий инженер данных в VK Видео, Москва

#гибрид

Компания:Vk

🔹Задачи

-Разрабатывать и поддерживать процессы обработки и доставки данных для аналитических и ML команд

-Собирать витрины, оптимизировать

-Писать адхоки и выгрузки, раздебаги

-Собирать требования

🔹Требования

-Понимание работы параллельных вычислений на кластере

-Опыт с Airflow, Spark, Hadoop, ClickHouse, YT (опционально)

-Знание Python: алгосы базовые (для понимания оптимального кода), классы и прочий сложный код (для чтения исходников и создания велосипедов типа операторов/сервисов)

-Знание Git и работа с кодом в команде (ревью)

Контакты: Откликнуться

IT Jobs 💬 в Telegram | 💙 в VK | 💬 в Max

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Python
Apache Airflow
Apache Spark
Hadoop
ClickHouse
Git
ETL
Data Warehousing

Возможные вопросы на собеседовании

Проверка понимания архитектуры распределенных вычислений, критически важной для работы со Spark.

Расскажите, как происходит распределение данных и вычислений в Spark (Shuffle, Partitioning) и как вы боролись с проблемой перекоса данных (Data Skew)?

VK активно использует ClickHouse для аналитики; важно понимать нюансы оптимизации.

Какие движки таблиц в ClickHouse вы использовали и в каких случаях стоит выбирать ReplicatedMergeTree вместо обычного MergeTree?

Вакансия предполагает создание кастомных операторов и сервисов.

Опишите ваш опыт создания кастомных операторов или хуков в Airflow. В каких ситуациях стандартных решений было недостаточно?

Проверка навыков написания эффективного кода на Python.

Как вы подходите к оптимизации использования памяти в Python-скриптах при обработке больших объемов данных локально?

Ведущий инженер должен уметь взаимодействовать с заказчиками данных.

Как вы выстраиваете процесс сбора требований у ML-команд, чтобы итоговая витрина данных была максимально эффективной и масштабируемой?

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Россия

Откликайтесь
на вакансии с ИИ

Ведущий инженер данных в VK Видео

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в vk уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите, как происходит распределение данных и вычислений в Spark (Shuffle, Partitioning) и как вы боролись с проблемой перекоса данных (Data Skew)?

Какие движки таблиц в ClickHouse вы использовали и в каких случаях стоит выбирать ReplicatedMergeTree вместо обычного MergeTree?

Опишите ваш опыт создания кастомных операторов или хуков в Airflow. В каких ситуациях стандартных решений было недостаточно?

Как вы подходите к оптимизации использования памяти в Python-скриптах при обработке больших объемов данных локально?

Как вы выстраиваете процесс сбора требований у ML-команд, чтобы итоговая витрина данных была максимально эффективной и масштабируемой?

Похожие вакансии

Tech Lead Data Engineer / Руководитель сопровождения и развития СККД

ML Lead

Тимлид команды data‑инженеров

Team Lead Data Science / ML

MLOps инженер (Team Lead)

MLOps инженер (Тимлид)

Устали искать работу? Мы найдём её за вас

Откликайтесьна вакансии с ИИ

Ведущий инженер данных в VK Видео

Анализ зарплаты

Сопроводительное письмо

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в vk уже сейчас

Описание вакансии

Создайте идеальное резюме с помощью ИИ-агента

Навыки

Возможные вопросы на собеседовании

Расскажите, как происходит распределение данных и вычислений в Spark (Shuffle, Partitioning) и как вы боролись с проблемой перекоса данных (Data Skew)?

Какие движки таблиц в ClickHouse вы использовали и в каких случаях стоит выбирать ReplicatedMergeTree вместо обычного MergeTree?

Опишите ваш опыт создания кастомных операторов или хуков в Airflow. В каких ситуациях стандартных решений было недостаточно?

Как вы подходите к оптимизации использования памяти в Python-скриптах при обработке больших объемов данных локально?

Как вы выстраиваете процесс сбора требований у ML-команд, чтобы итоговая витрина данных была максимально эффективной и масштабируемой?

Похожие вакансии

Tech Lead Data Engineer / Руководитель сопровождения и развития СККД

ML Lead

Тимлид команды data‑инженеров

Team Lead Data Science / ML

MLOps инженер (Team Lead)

MLOps инженер (Тимлид)

Устали искать работу? Мы найдём её за вас

Откликайтесь
на вакансии с ИИ