
Старший инженер данных
в Альфа-банк
от 200 000 ₽/мес на руки

📍 Москва (м. Технопарк)
Офис или гибрид
Специализация
Data Engineering
Уровень
Senior
Требуемый опыт
3+ лет
Технологии/инструменты
Python
SQL
PySpark
NumPy
pandas
XML
JSON
Oracle
Greenplum
Cassandra
PostgreSQL
Airflow/Oozie
Scala
Spark
Kafka
Flink
Обязанности
- Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем банка.
- Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения.
- Разработка и поддержание в актуальном состоянии документации по разработанному функционалу.
- Разработка контролей качества данных.
- Своевременное отражение статуса выполнения задач в Jira.
- Проверка качества кода (код-ревью), написанного инженерами и младшими инженерами данных.
Наши пожелания к кандидатам
- Python — уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП (функциональное программирование), опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных — NumPy, pandas.
- Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, XML, JSON) из внешних источников.
- Способность разобраться с API поставщиков данных, используя доступную документацию.
- SQL — умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum, Cassandra.
- Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных — Airflow/Oozie.
- Опыт разработки сложных, высоконагруженных приложений обработки данных на основе Spark (Scala, PySpark), уверенное знание настроек Spark и их влияния на производительность приложений Spark, умение профилировать приложения Spark для оптимизации их производительности.
- Опыт разработки приложений и сервисов потоковой обработки данных (real-time) на основе Kafka, Flink.
-
Владение навыком ориентироваться в коде, написанном другими разработчиками Linux:
- Продвинутые навыки работы с командной строкой.
Опционально
- Понимание процессов Data Goverment, Data Quality.
- Опыт решения задач с BI-инструментами (PowerBI/Tableau).
Что мы предлагаем
- Стабильную работу в одном из крупнейших банков страны.
- Сильное DS community, большое разнообразие рабочих и внерабочих активностей.
- Конкурентную заработную плату, соцпакет.
- Условия для роста и развития (в т.ч. конференции, тренинги, внутренние программы развития).
- Дружный коллектив единомышленников (все специалисты, занимающиеся машинным обучением объединены одним департаментом для максимально плотного и продуктивного обмена знаниями).
- Передовой стек технологий, высокопроизводительное оборудование.
- Возможность решать разнообразные прикладные задачи с выводом в промышленную эксплуатацию, возможность существенно влиять на результат (в т.ч. в бизнес-смысле) и способы его достижения (вплоть до внесения изменений в архитектуру).
- Квартальный бонус по результатам работы.
- ДМС, страхование жизни.
- Корпоративное обучение.

Анастасия ПономареваRecruiter

О компании Альфа-банк
Сфера
Банки / Финтех
Инвестиции
$100M+
Размер
1001+
Альфа-банк — крупнейший независимый частный банк в России, лучший работодатель России по версии hh․ru и Хабр. 30 лет подряд занимает ведущие позиции в сегментах банковского бизнеса. Клиентская база составляет более 550 тысяч корпоративных клиентов и более 16 млн физлиц.