Четыре IDE, тьма агентов, ноль свободного времени
В какой-то момент понял, что у меня открыто четыре IDE с разными проектами. В каждой крутится одна или несколько сессий с Claude AI. А я сижу и жонглирую вкладками. Планирование. Ревью там, где критично. Там, где не критично, накидываю хитрые тестовые сценарии, тестируя проект как black box. Постоянно переключаю контекст у себя в голове чтобы понять, а на каком шаге я на этой вкладке и в этом проекте. И потом бам, пора спать. Или есть. Или идти гулять с ребёнком. И в этот момент все процессы останавливаются. Агенты ждут. И получается по факту, что я слабое звено. Не модель с её косяками, а я. Начинаю меньше спать. Парадокс, вроде как должно было быть все наоборот: модели работают, ты спишь. Ан нет.
Тесты вместо review
Еще заметил, что чаще начал не ревьюить, а придумывать тесты и заставлять реализовывать dry run с последующими прогонами и анализом логов. Естественно там, где это не критично с точки зрения финансовых потерь. Потом начал экспериментировать там, где критично.
Пример. Надо загрузить на EVM смарт-контракт цены из внешних источников и как можно быстрее. Думаю, ну давай на Rust. Подписываемся на CEX, слушаем ивенты по веб-сокетам. При определенных изменениях кидаем транзакцию в контракт. И тут желательно сразу выдать ему “экспертизу”: счетчик nonce делаем offline, чтобы не кидать eth_getTransactionCount. estimateGas не вызываем. gasLimit зашьем константный. В общем убираем все запросы кроме непосредственно sendRawTransaction. Делаем round robin для адресов. Вдогонку еще пару рекомендаций под конкретные EVM. Он делает, а я сижу и думаю, догадается как тики с новыми ценами обрабатывать или нет. Надо было сразу сказать.
И наконец все готово. Агент выдает отчет. Говорит: “можно тестить”. Но мы то знаем. По итогу имеем какую-то поделку на Rust. Внутрь не заглядываем. Как проверить, что результат приемлем без ревью? Начинаем копать:
-
Сделай параллельно код ревью. Из текущего контекста и из чистого;
-
А что будет, если коннект к внешним источникам цен отвалится?
-
А как работает механизм с
gasPrice, ты не сольешь весь депозит на fee в какой-нибудь новой сети? -
Сколько времени занимает обработка тика изменения цен? Транзакции отправляешь асинхронно?
-
Замокай отправку транзакций и сделай dry run, посмотрим логи.
-
и т.п.
В итоге пробегаем по большому числу сценариев с проблемами при отправке транзакций, добавляя фоновые сервисы контроля баланса, контроля подтверждения транзакций и nonce. Каждый раз переспрашиваешь: «а ты правильно сделал синхронизацию?». Шаг за шагом получается вполне рабочий бот. Да, возможно больше всего протестирован happy path, но какие‑то заранее известные по опыту проблемы тоже закрыты с покрытием тестами. И код я не смотрел.
Но это когда тебе всё понятно и ты выступаешь в роли эксперта, а что если ты не знаешь как делать лучше? Заметил, что как только доходим до такого момента, где я сам не знаю как лучше, я уже начинаю ждать и где‑то надеяться, что агент решит всё за меня. Хотя только что вроде как «возил» его пользуясь тем, что знаю чуть больше. Думаю, ну сейчас я опишу варианты ему, как я всё вижу, а он сделает ресерч и скажет точно: «лучше вот так». А этого не происходит.
Ладно, хватит нытья, подведем итог. Роль разработчика трансформировалась. Причем, насколько я вижу, в перспективе это будет не просто AI‑оператор, а эксперт‑оператор AI уровня сеньора. Нужно будет вести N проектов параллельно, иметь серьезный бэкграунд в разработке, но самое важное — всё также нести ответственность за результат. А для решения проблемы со сном… ну, кроме очевидного — спать больше — вероятно появится оркестрация не только агентов, но и операторов. Что‑то типа единого информационного пространства проекта(ов). Подключаешься, берешь задачи и в том числе простаивающих агентов (если есть права и позволяет уровень скилов), которые ждут ревью и дальнейших команд. Смотришь контекст и принимаешь решения. Как оператор горячей линии. Есть еще пара тройка идей что может нас ждать, но это как будто отдельная статья.
Перед тем как пожелать всем добра спрошу, у вас тоже открыта куча проектов параллельно? Всем добра!
Автор: miv7

