yandex
Б
Билайн
Страна
Россия
+500% приглашений

Откликайтесь
на вакансии с ИИ

Ускорим процесс поиска работы
УдалённоПолная занятость

Data Engineer

ИИОценка ИИ

Сильный бренд, работа с современным стеком (LLM, RAG, Big Data) и удаленный формат делают вакансию очень привлекательной для опытных инженеров. Отсутствие указанной вилки зарплаты — единственный существенный минус.


Вакансия из Quick Offer Global, списка международных компаний
Пожаловаться

Сложность вакансии

ЛегкоСложно
ИИОценка ИИ

Позиция требует уверенного владения стеком Big Data (Hadoop, Spark, Airflow) и одновременно глубоких знаний в области LLM и RAG, что встречается нечасто. Обработка данных объемом более 10 ТБ добавляет сложности в части оптимизации производительности.

Анализ зарплаты

Медиана280 000 ₽
Рынок220 000 ₽ – 350 000 ₽
ИИОценка ИИ

Зарплата в объявлении не указана, однако для Data Engineer с опытом от 2 лет и навыками в области LLM на российском рынке медиана составляет около 250 000 - 300 000 рублей. Билайн обычно предлагает конкурентные условия, соответствующие рыночным ожиданиям для Middle/Senior специалистов.

Сопроводительное письмо

Меня заинтересовала вакансия Data Engineer в Билайн, так как она сочетает в себе классическую работу с Big Data и актуальные задачи по разработке LLM-агентов и RAG-систем. Имея опыт работы с PySpark, Hadoop и Airflow более двух лет, я успешно проектировал ETL-пайплайны для обработки терабайтных массивов данных и оптимизировал сложные SQL-запросы.

Кроме того, мой интерес к Machine Learning и понимание архитектуры Transformer позволят мне эффективно участвовать в задачах по fine-tuning моделей и интеграции LLM в продукты компании. Я знаком с Gitlab CI/CD и придерживаюсь принципов написания чистого, документированного кода. Буду рад обсудить, как мой опыт поможет развитию ваших систем хранения и обработки данных.

+250% к просмотрам

Составьте идеальное письмо к вакансии с ИИ-агентом

Составьте идеальное письмо к вакансии с ИИ-агентом

Откликнитесь в Билайн уже сейчас

Присоединяйтесь к команде Билайн и создавайте передовые решения на стыке Big Data и LLM!

Описание вакансии

Data Engineer

#удаленка

Компания: Билайн

🔹Итак, вам предстоит:

-Проектирование, разработка и поддержка ETL/ELT-пайплайнов.

-Интеграция с различными источниками данных (API, базы данных, файлы, очереди).

-Оптимизация процессов обработки больших данных (10ТБ+).

-Работа с распределёнными системами хранения и вычислений (Hadoop, Spark).

-Настройка оркестрации и мониторинга пайплайнов в Airflow.

-Поддержка и развитие хранилища (ClickHouse, HDFS, Postgresql)

-Подготовка витрин данных для аналитиков и ML-команды.

-Документация пайплайнов, best practices в команде.

-Разработка инструментов для интеграции LLM в продукты (API, библиотеки и пр.)

-Разработки агентов и агентных систем

-Разработка баз знаний для RAG

-Fine-tuning/адаптация LLM для специфичных задач/домен (PeFT, SFT).

🔹Мы будем рады рассмотреть вашу кандидатуру, если у вас есть:

-Опыт работы Data Engineer от 2 лет.

-Опыт коммерческой разработки на Python (3.6+).

-Опыт работы с PySpark и экосистемой Hadoop (HDFS, Yarn).

-Понимание принципов работы распределённых вычислений и оптимизации Spark-джоб.

-Практический опыт работы с Airflow (DAG’и, сенсоры, операторы, оптимизация).

-Знания основ Machine Learning / Deep Learning

-Глубокое понимание архитектуры Transformer.

-Умение работать с большими объёмами данных (10ТБ+).

-Знание SQL (в т.ч. оптимизации сложных запросов)

-Опыт работы с системами контроля версий (у нас Git + Gitlab).

Контакты: Откликнуться

🔥 Подписаться на наши каналы / @best_itjob / @it_rab

+400% к собеседованиям

Создайте идеальное резюме с помощью ИИ-агента

Создайте идеальное резюме с помощью ИИ-агента

Навыки

  • Git
  • Python
  • Machine Learning
  • LLM
  • SQL
  • PostgreSQL
  • Deep Learning
  • RAG
  • PySpark
  • Airflow
  • Hadoop
  • ETL
  • GitLab
  • ELT
  • HDFS
  • ClickHouse

Возможные вопросы на собеседовании

Вакансия включает задачи по оптимизации Spark-джоб для объемов 10ТБ+.

Расскажите о вашем опыте оптимизации PySpark приложений: как вы боретесь с проблемой data skew и какие стратегии джойнов используете?

Работа предполагает использование Airflow для оркестрации сложных пайплайнов.

Как вы организуете мониторинг и обработку ошибок в Airflow DAG, если один из этапов интеграции с внешним API завершается неудачно?

В обязанности входит разработка баз знаний для RAG.

Какие векторные базы данных вы использовали и как вы подходите к выбору стратегии чанкинга (chunking) для построения эффективной RAG-системы?

Упоминается fine-tuning LLM с использованием PeFT и SFT.

В чем преимущество методов PeFT (например, LoRA) перед полным дообучением модели в условиях ограниченных вычислительных ресурсов?

Работа с ClickHouse и Postgresql.

В каких случаях вы выберете ClickHouse вместо классической реляционной БД для хранения витрин данных?

Похожие вакансии

NDA
2 000 ₽ – 2 500 ₽

ML разработчик (Senior)

SeniorУдалённо
n8n · Generative AI · Python · JavaScript · TypeScript · React · LangChain · PostgreSQL · REST · GraphQL · FastAPI · RAG · Vector Database · Prompt Engineering
+14 навыков
КС
КВИКЛИ СЕЧ ИТ
300 000 ₽ – 450 000 ₽

Senior / Middle+ Data Scientist

SeniorУдалённо
Python · Apache Spark · Machine Learning · Recommendation Systems · Ranking · NLP · LLM · MLOps · A/B Testing · Uplift Modeling
+10 навыков
S
Selecty
220 000 ₽ – 310 000 ₽

MlOps / Python Backend Engineer (ML)

SeniorУдалённо
Python · FastAPI · Flask · Kafka · Docker · Kubernetes · Airflow · Spark · Hive · SQL · MLOps · NLP · Computer Vision
+13 навыков
NDA
от 2 000 ₽

Data Scientist Senior

SeniorУдалённо
Python · Pandas · NumPy · Matplotlib · Seaborn · Plotly · Scikit-learn · SciPy · statsmodels · CatBoost · XGBoost · LightGBM · ARIMA · Prophet · Deep Learning · CNN · RNN · LSTM · Attention · Feature Engineering · tsfresh · EDA
+22 навыков
NDA
168 358 ₽ – 297 075 ₽

ML разработчик (Middle)

MiddleУдалённо
Python · Scikit-learn · Pandas · NumPy · PyTorch · TensorFlow · JAX · SQL · Spark · PySpark · Dask · Docker · Kubernetes · Git · DVC · GitLab CI · GitHub Actions · Jenkins · Prometheus · Grafana · Evidently AI · MLflow · AWS · GCP · Azure ML · Kubeflow · Airflow · FastAPI · Flask · Triton Inference Server · Feast · Tecton · Hopsworks · Horovod · Ray
+35 навыков
C
Centicore
340 000 ₽ – 360 000 ₽

Senior Data Scientist

SeniorУдалённо
Python · Machine Learning · Uplift Modeling · LightGBM · XGBoost · CatBoost · Scikit-learn · Pandas · NumPy · SQL · Apache Spark · Hadoop · Apache Hive · MLOps
+14 навыков
более 1000 офферов получено
4.9

1000+ офферов получено

Устали искать работу? Мы найдём её за вас

Quick Offer улучшит ваше резюме, подберёт лучшие вакансии и откликнется за вас. Результат — в 3 раза больше приглашений на собеседования и никакой рутины!

Б
Билайн
Россия