- Страна
- Россия
Откликайтесь
на вакансии с ИИ

Middle / Middle+ Инженер данных Бизнес-домена
Интересный проект в крупном ритейле с современным стеком технологий (Greenplum, ClickHouse, Kafka). Полная удаленка и четко сформулированные требования делают вакансию привлекательной для опытных инженеров.
Сложность вакансии
Роль требует глубоких практических знаний Greenplum и ClickHouse, а также продвинутого владения SQL и навыков работы с Kafka. Высокая планка ответственности за результат и необходимость самостоятельной работы с API и S3 повышают сложность позиции.
Анализ зарплаты
Зарплата в объявлении не указана, но для Middle+/Senior Data Engineer на российском рынке с таким стеком (Greenplum, Kafka, ClickHouse) медиана составляет около 300 000 - 350 000 рублей. Предложение будет конкурентоспособным, если попадет в этот диапазон.
Сопроводительное письмо
Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Лемана Про Ритейл уже сейчас
Присоединяйтесь к команде Лемана Про и создавайте надежную аналитическую платформу для управления талантами!
Описание вакансии
ID 2611 - Middle / Middle+ Инженер данных Бизнес-домена
🌍 Локация: Любая
💼 Удаленно
🕔 Занятость: фулл тайм
🏢 Проект: Лемана Про Ритейл
В команде данных и аналитики по сотрудникам мы строим систему, которая отвечает на главные вопросы бизнеса: «Кто наши люди? Как они растут? Где зоны для улучшения?». Нам нужен инженер данных, который превратит разрозненные кадровые события в чистый, надежный и готовый к анализу слой данных.
💡 Требования:
• ETL/ELT пайплайны
• работа с API
• обработка больших объемов данных
• SQL на продвинутом уровне:
• сложные join’ы, оконные функции
• оптимизация запросов под большие объемы
• понимание планов выполнения
• Практический опыт работы (не «знаком», а делал в проде):
• Greenplum (понимание MPP, распределение данных, оптимизация)
• ClickHouse (построение витрин, работа с большими таблицами)
• MS SQL Server
• Kafka:
• опыт работы с consumer/producer
• понимание семантики доставки и обработки сообщений
• Интеграции:
• уверенная работа с REST API (пагинация, ретраи, обработка ошибок)
• S3-совместимые хранилища:
• чтение/запись, организация данных, партиционирование
• Желательно:
• Опыт работы с Trino (федеративные запросы, работа с несколькими источниками)
• Опыт построения DWH (staging / dds / marts)
• Понимание data lineage и контроля качества данных
• Опыт orchestration (Airflow или аналоги)
• Важна самостоятельность и ответственность за результат
📋Задачи:
• Разработка и поддержка пайплайнов загрузки и трансформации HR-данных
• Интеграция источников (API, Kafka, БД, файловые хранилища)
• Построение витрин и обеспечение их консистентности
• Оптимизация производительности и стоимости обработки данных
• Обеспечение стабильности (обработка сбоев, ретраи, мониторинг)
📨 Оставить отклик можно по Откликнуться
❗️Пожалуйста, откликайтесь только при полном соответствии вакансии
❗️При отклике, указывайте, ID вакансии, ваш стек и прикладывайте резюме.
❗️Без ID вакансии отклики не будут рассматриваться
#Data #Engineer #Удаленно #вакансия
Создайте идеальное резюме с помощью ИИ-агента

Навыки
- SQL
- Airflow
- Kafka
- ETL
- REST API
- S3
- ELT
- ClickHouse
- Trino
- MS SQL Server
- DWH
- Greenplum
Возможные вопросы на собеседовании
Проверка понимания архитектуры MPP-систем, критически важной для работы с Greenplum.
Расскажите, как вы выбираете ключ дистрибуции в Greenplum и к каким последствиям может привести неудачный выбор?
Оценка практического опыта работы с ClickHouse и понимания его специфики.
Какие движки таблиц в ClickHouse вы использовали для построения витрин и как решали проблему дедупликации данных?
Проверка навыков работы с потоковыми данными и понимания гарантий доставки.
В чем разница между семантиками доставки 'at-least-once' и 'exactly-once' в Kafka, и как обеспечить последнюю при записи в БД?
Оценка умения оптимизировать производительность запросов.
На какие узлы в плане выполнения SQL-запроса вы обращаете внимание в первую очередь при поиске узких мест?
Проверка навыков интеграции и обработки ошибок.
Как вы организуете процесс обработки ошибок и ретраев при получении данных через REST API с пагинацией?
Похожие вакансии
ML разработчик (Middle)
Middle Data Science (Проект Альфа)
Middle инженер данных
Data инженер Middle+
Middle / Middle+ ML разработчик
Middle / Middle+ Data Инженер
1000+ офферов получено
Устали искать работу? Мы найдём её за вас
Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!
- Страна
- Россия