Архив рубрики ‘sla’

Актуальность техстека как задача: наш путь от хаоса к регулярным SLA-апдейтам

В предыдущей статье я рассказывал, что наша команда Платформы получила цель «Техстек всегда актуален». Но многие ли компании могут похвастаться тем, что все компоненты их стека не покрылись пылью, а регулярно обновляются? Скажу честно: мы тоже долго не занимались этим системно, пока не поняли, что эта работа приоритетна. Мы больше не хотим попадать в ситуацию, […]

Где кроется реальный эффект от ИИ-бота техподдержки: как посчитать его до внедрения

Когда бизнес обсуждает внедрение ИИ-бота, разговор часто быстро уходит в технологии. Какая модель? Голос или текст? RAG или сценарий?Как отреагирует потребитель? Сколько будет стоить разработка?Насколько похожим на человека будет бот, или все догадаются сразу? Все это важные вопросы. Но, на мой взгляд, начинать нужно не с них. Для любого управленца главная цель внедрения ИИ-бота — […]

От первой линии — к аналитике: как перестроить саппорт, чтобы он растил кадры, а не выгорал

Саппорт принято считать тупиком. Местом, куда приходят, чтобы потом уйти куда‑нибудь «поинтереснее» — в разработку, в аналитику, в DevOps. Или вообще из IT. С этим я не согласен. За последние годы из моей команды поддержки десять человек ушли в аналитику, тестирование и смежные направления. Большинство остались внутри — просто перешли на другие роли. Кто‑то ушёл наружу, это нормальная часть процесса. При этом SLA реакции вырос с 61% до 79%, […]

SLA как инструмент, а не отчёт

Часть 1. Как подружить бизнес и инженеров через общие цифры Наш прежний SLA формально выглядел корректно: была формула, «четыре девятки» и отчёты. Но в моменты сбоев это не помогало ответить бизнесу на вопросы: сколько времени мы были недоступны, какова потенциально недополученная прибыль и каким был вклад разных подразделений в «наши девятки». Команды по‑своему считали простои […]

Между нами SLA: как бизнесу и поддержке договориться до первого инцидента

Разбор SLA от человека, которого подключают, когда сайт недоступен, заказы не проходят, а в чатах уже ищут виноватых. Рассказываю, как SLA помогает без лишних споров переживать такие моменты.  Меня зовут Эдуард, я руковожу отделом DevOps и отвечаю за сопровождение проектов по SLA 24/7. Хочу разобрать частую боль команд поддержки. Пока сервис работает стабильно, кажется, что […]

Как мы за 3 месяца обучили 15 человек поддержке и сэкономили бизнесу десятки миллионов рублей

Работа в крупной ИТ-компании — это здорово. Особенно когда проекты есть. И они были. Но один из крупнейших заказчиков, испытав трудности из-за надвигающегося кризиса, решил оптимизировать расходы и отказаться от поддержки, взяв всё в свои руки. Годами компания не вникала в проект. У них и так хватало сложностей с другими его частями — поддержку разных […]

2026 — год внедрения XLA: почему SLA больше недостаточно

В какой-то момент я перестал верить в «зеленые» дашборды. Вам, возможно, знакома ситуация, когда по красивым отчетам SLA 99,9% доступности сервиса, 95% заявок закрываются в срок, но при этом при общении с заказчиком выясняется, что несмотря на отличные показатели работать невозможно, системы периодически зависают, интерфейс неудобный. 

Что делать, когда AI-агент «упал»: архитектура отказоустойчивости

Понедельник, 9 утра. Начало рабочей недели. API OpenAI лёг. Или лимиты закончились. Или интернет в офисе пропал. Что делает AI-агент? Ничего. А процесс, который он обслуживал, встаёт. Заявки копятся, договоры не согласовываются, клиенты ждут. И хуже всего — люди не знают, что агент не работает. Думают, что всё идёт по плану. Реальные сценарии сбоев За […]

Как измерять техническое качество и SLA, чтобы команда работала стабильно

Всем привет! Меня зовут Александр Пряхин, я технический руководитель в Авито Подработке. В свободное от руководства в Авито время я преподаю и руковожу курсами, консультирую людей и компании в области IT. За 17 лет опыта в IT я успел поработать в самых разных командах – и там, где наблюдаемость была выстроена от и до, и там, […]