Архив рубрики ‘автоматизация разработки’

Я отдал разработку автономному ИИ — промежуточные итоги за 178 релизов

Продолжение эксперимента, в котором автономный пайплайн пишет и катит код в прод без человеческого ревью. 178 релизов, 1.4 млрд токенов, ноль строк кода, прочитанных человеком перед мержем. Что сработало, что сломалось и почему главная работа теперь — не код.

AI предлагает, мержу я: почему я не даю агенту последний ход

Есть неприятная иллюзия: если модель стала сильнее, ей можно дать больше свободы. В кодинге это быстро выходит боком. Агент пишет много, уверенно, иногда даже красиво. Потом ты открываешь diff и понимаешь, что вместе с полезным кодом туда попало… ну, назовём это решениями, которые ты сам никогда бы не принял. У меня после нескольких таких заходов […]

Что произойдёт с продуктом и техдолгом, если разработку отдать автономному AI: ставлю эксперимент

Заявка от незнакомца → AI пишет код → правка в общем билде, который видят все Коротко о себе

ИИ-агент сам создал тикет, сам же его взял, и сам закрыл. Менеджер ничего не заметил

Автономные агенты в разработке уже встроены в CI/CD живых команд, закрывают реальные тикеты и пишут код, который идёт в прод. Проблема не в том, что они это делают плохо, а в том, что метрики при этом выглядят слишком отлично.

Как я сделал скилл для AI-ревью плана и кода — и зачем мне две модели

Когда одна и та же модель пишет код и проверяет его, она пропускает свои ошибки. Она «помнит», почему приняла именно это решение, и не ставит его под сомнение. Знакомо? Как вычитывать собственный текст: глаз замыливается, мозг подставляет правильный смысл туда, где его нет. В нормальной команде эта проблема решена давно: автор кода ≠ ревьюер. Два […]

Как выжать максимум из подписки Google AI: параллельные агенты и кросс-модельный консенсус

Всем привет! У многих из нас куплена максимальная подписка на Google AI Ultra — правда же? Да, она стоит не копейки — по акции первые 3 месяца обходятся в $124.99/мес, а потом ценник подрастает. Но мы заставим ее отработать каждый цент. Обычно мульти-агентные системы ассоциируются с космическими счетами за API. Но идея вот в чем: […]