Недоступность сервиса api.mindbox.ru для 99% клиентов в течение 46 минут

Incident Report for Mindbox

Postmortem

На подготовку детального разбора потребовалось больше времени. Опубликуем его не позднее 4 июня.

Posted May 30, 2025 - 09:55 UTC

Resolved

С 17:54 (мск) доступность восстановлена, сервис работает в штатном режиме.

На данный момент мы остановили работы до принятия шагов, исключающих возможные ошибки. С детальным разбором и следующими шагами вернёмся в течение двух недель.
Posted May 07, 2025 - 15:42 UTC

Monitoring

В 17:54 (мск)завершили работы по восстановлению доступности сервиса.

Наблюдаем постепенное восстановление работоспособности, продолжаем мониторинг. Вернёмся с обновлением статуса в течение получаса.
Posted May 07, 2025 - 15:08 UTC

Update

C 17:45 (мск) частично восстановлена работоспособность сценариев.

Продолжаем работы по восстановлению доступности сервиса. Вернёмся с обновлением статуса в течение получаса.
Posted May 07, 2025 - 14:56 UTC

Identified

C 17:08 (мск) наблюдается недоступность сервиса api.mindbox.ru для 99% клиентов. На проектах недоступна работа с административной панелью, обработка синхронных операций завершается с ошибками 5хх, скапливается очередь обработки асинхронных операций

Инженеры локализовали проблему, предпринимают шаги для её устранения. Вернёмся с обновлением статуса в течение получаса.
Posted May 07, 2025 - 14:37 UTC

Investigating

Мониторинг зафиксировал нарушение работы наших сервисов. Инженеры уже подключились к анализу. Мы соберём больше фактуры и вернёмся с обновлением в течение часа.
Posted May 07, 2025 - 14:19 UTC
This incident affected: Персонализация данных (Javascript API, Передача данных для клиентских интерфейсов, Отображение виджетов, Операции персонализации), Процессинг скидок и баллов (Расчёт скидок, Синхронное сохранение заказов), Административная панель, and Отправка коммуникаций (Высокоприоритетные сценарии, Отправка массовых рассылок).