Архив рубрики ‘управление инцидентами’

Ретро: Не Ной Слабо, Ной Достойно. Как Превратить Жалобы в Профит

Всем привет! Меня зовут Ксюша, и я backend QA-лид нескольких команд в EXANTE. В начале этой истории я была обычным QA в команде, которая отвечает за ядро нашего backoffice.  Думаю, многие из вас знакомы со Scrum и его ивентами, но если нет — дальше речь пойдет о ретроспективе, одной из ключевых встреч этого фреймворка. Вначале […]

Если инцидент закрыт, это не значит, что проблема решена

Пятница, 23:40, прод лежит. Дежурный поднимает сервис за сорок минут: перезапустил контейнер, всё заработало. Инцидент закрыт, MTTR красивый, все спать. Через десять дней то же самое: тот же сервис, та же ошибка в логах. Снова подняли и снова закрыли. MTTR красивый, баг живой