Мы — команда продукта CEDAR. Это сервис класса Big Data для технического контроля результатов репликации данных из систем Банка в Hadoop.
Наша цель — обеспечить качество данных в централизованном хранилище Банке (10+ петабайт данных).
Задача интересна значительными объёмами данных (до 10 терабайт изменений в сутки, сотни миллионов строк изменений); разнообразием систем-источников, в каждой из которых свои настройки базы данных; и постоянным асинхронным изменением источника и его реплики.
Сбербанк — крупнейший банк в России, Центральной и Восточной Европе, один из ведущих международных финансовых институтов. Самый дорогой российский бренд и самый сильный банковский бренд в мире по версии Brand Finance.