Недоступность административной панели Mindbox для 88% клиентов в течение 12 минут
Incident Report for Mindbox
Postmortem

27 марта с 17:19 до 17:32 (мск) для 88% клиентов наблюдалась недоступность административной панели.

Корневая причина недоступности — неправильная регистрация нового Feature toggle.

Влияние на клиента

В период инцидента у 88% клиентов была недоступна административная панель.

Как выявляли и устраняли инцидент

17:19 — система мониторинга зафиксировала недоступность административной панели, инженеры приступили к диагностике

17:32 — проблему полностью устранили у всех пострадавших клиентов

Отчёт

Для изменения доступного функционала на проектах в процессе разработки и при релизе мы используем переключатели (Feature toggles). Обновление списка должно происходить с помощью выкладки кода, во время которой, для обеспечения непрерывной работы, одновременно работают и старые, и новые версии проектов.

В ходе обновления Feature toggle был добавлен некорректно. Ошибочное заведение вызвало преждевременное удаление переключателя и повлекло недоступность административной панели.

Что улучшим

Добавим проверки в инструменты разработчиков, больше нельзя будет технически зарегистрировать feature toggle неправильно – апрель 2024

Posted Apr 09, 2024 - 10:30 UTC

Resolved
С 17:15 до 17:27 (мск) наблюдались ошибки в работе административной панели для 88% клиентов.

На данный момент сервис работает в штатном режиме. Вернемся с детальным разбором ситуации и следующими шагами в течение трёх недель
Posted Mar 27, 2024 - 14:39 UTC
Investigating
С 17:21 (мск) наблюдается недоступность административной панели Mindbox для 88% клиентов. Не работает вход в личный кабинет проектов

Инцидент находится в работе у дежурной команды, вернемся со статусом в течение часа.
Posted Mar 27, 2024 - 14:29 UTC
This incident affected: Административная панель.