Гороховский рассказал о причинах последних сбоев в monobank
В прошлом месяце и вчера в monobank произошли сбои. О случившемся рассказал соучредитель банка Олег Гороховский.
В прошлом месяце и вчера в monobank произошли сбои. О случившемся рассказал соучредитель банка Олег Гороховский.
20 июля у monobank произошел масштабный сбой — приложение не обновлялось, средства на счета не заходили. Сбой стоил компании более 27 млн грн. Олег Гороховский сообщил, что за этот период проценты по кредитам не снимали. Компенсации должны получить более 1 521 716 клиентов банка.
По словам Гороховского, проблемы являются частью рутинной работы любого банка, просто в случае с monobank это заметнее, потому что его пользователи чаще открывают приложение, пишет AIN.UA.
Последний сбой произошел вчера, 1 августа, продолжавшийся 10 минут. Проблема была с отправкой Р2Р.
«Мы ломаемся не чаще других. Клиенты действительно гораздо чаще используют нас, чем обычные банки. Для понимания: 2,2 млн клиентов заходят в приложение ежедневно и 5,6 млн — ежемесячно.
На прошлой неделе было два сбоя, связанных между собой одной и той же проблемой. Она уже устранена. Сейчас наблюдается краткосрочная проблема с отправкой Р2Р, она уже локализована», — отметил Гороховский.
Олег Гороховский раскрыл технические детали о причинах и последствиях масштабных сбоев 20 и 26 июля, а также о третьем случае.
«Проблема была с сервисом, отвечающим за взаимодействие с бэкофисным блоком клиентской базы. Его конфигурация была не оптимальна и начала не выдерживать пиковые нагрузки. Кроме того, она была не запроектирована на рестарт из-за высоких нагрузок.
После первого падения, когда сбой продолжался 3 часа 20 минут, мы это исправили и научились восстанавливаться быстро. В результате второе аналогичное падение длилось уже 50 минут. Потом было еще два, но мы поднялись через 10 и 6 минут соответственно.
Сегодня этот сервис после рефакторинга работает стабильно и больше не падает. Также мы заказали дополнительный аудит IT-архитектуры.
Короткий сбой, случившийся 1 августа, произошел из-за тайм-аута сервиса Р2Р-переводов, возвращающего контрактную книгу. Там идут постоянные апдейты — какой-то патч был некорректен. Мы откатились на предыдущую версию — это нормальная текущая работа. Такие таймауты могут происходить несколько раз в неделю по 2–3–5–10 минут».