6 июля «Сбербанк» остановил обслуживание всех своих пластиковых карт и работу системы интернет-банкинга. Сбой продлился 3 часа (с 17:00 до 20:00).
Виктор Орловский, являющийся старшим вице-президентом и ИТ-директором «Сбербанка», попросил прощения за принесенные неудобства и рассказал о деталях возникшего инцидента.
Процессинг «Сбербанка» (название системы — Way4) работает на основе 11 версии Oracle и обслуживает в целом 70 млн карт, по которым ежедневно осуществляется более 15 млн онлайн-транзакций. «Oracle пишет логи в онлайн-журналы, которые затем автоматически сбрасываются на диски. Таким образом, журналы никогда не переполняются. По какой-то причине СУБД перестал удалять события из журналов. После чего не прошел один из checkpoint-ов в системе, и она перестала отвечать на действия администратора. Систему перевели на резервный комплекс и запустили recovery (восстановление из резервной копии) базы», — пояснил ИТ-директор
Однако процесс восстановления остановился на середине. Процедуру возобновили «в полуручном режиме» без многопроцессорной обработки, что привело к большей затрате времени. Касательно архитектуры системы г-н Орловский сообщил, что «используется IBM P 795 c AIX7, базы Oracle 11.2.02 пока без RAC. ГЕО-кластер. Дисковые массивы HP». По его словам к поиску причины сбоя подключились сотрудники разработчика СУБД, компании Oracle.
На призывы некоторых наблюдателей за ситуацией уйти в отставку, Орловский сказал, что «все бросить и отойти в сторону — это самое легкое, а самое сложное — это взять себя в руки и найти решение, чтобы таких инцидентов не было».
«Сбербанк» — самый крупный российский банк. По данным на прошлый год его активы достигли показателя в 26,8%, что больше четверти банковской системы страны, доля в банковском капитале составляет 29,1%. ИТ-бюджет «Сбербанка» также достиг самой крупной отметки среди финансовых организаций страны — 26,8 млрд руб.