Resolved -
С 15:51 до 17:20 (мск) для 20% клиентов наблюдалась недоступность сервисов процессинга заказов, персонализации и алгоритмов рекомендаций.
В период инцидента на пострадавших проектах завершались с ошибкой синхронные операции расчёта, сохранения и редактирования заказов, операции возврата расчёта рекомендаций и не отображались виджеты персонализации на сайте.
Проблема была локализована в области одной из нодгрупп и устранена балансировкой нагрузки
Вернемся с детальным разбором отказа и следующими шагами в течение 3х недель.
Oct 31, 14:37 UTC
Identified -
В настоящий момент команда инженеров локализовала проблему в одной из групп нод и выполняет балансировку нагрузки.
Мы видим положительную динамику в уменьшении количества пострадавших проектов. Вернёмся с обновлением статуса в течение 30 минут
Oct 31, 14:19 UTC
Update -
С 15:51 (мск) для 20% клиентов наблюдается недоступность сервисов процессинга заказов, персонализации и алгоритмов рекомендаций.
Для этой части клиентов завершаются с ошибкой синхронные операции расчёта и сохранения заказов, результатов расчёта рекомендаций и отображения виджетов персонализации на сайте
Инцидент находится в работе у дежурной команды. Вернёмся с обновлением статуса в течение часа
Oct 31, 13:19 UTC
Investigating -
Инженеры получили сообщение об нарушениях и подключились к решению. Мы вернёмся с информацией в течение 30 минут.
Oct 31, 13:03 UTC