Альтман выиграл пари. Я строю фабрику агентов, чтобы выиграть следующее

Medvi выиграл на регуляторной дыре. Я ставлю на семь AI-агентов и портфель из пяти попыток

Антон Саркисян, CCO GPTunneL | ex.Yandex | ex.VK |


Две недели назад Альтман написал в NYT

Он сказал, что, похоже, выиграл пари. Помнишь то самое: про первое миллиардное предприятие от одного человека? NYT опубликовали профайл на компанию Medvi: два месяца разработки, $20K стартового капитала, $401M выручки в 2025, прогноз $1.8B на 2026, команда — два человека. Парень по имени Мэттью Галлахер. Ноутбук, три LLM, гостиная в Лос-Анджелесе. Идеальная обложка для AI-эры.

Прочитал профайл. Потом ещё раз. Потом пошёл в FDA проверить, что происходит.

Оказалось следующее. FDA выпустило официальное предупреждение за недостоверную маркировку. На сайте Medvi нашли подставных врачей в рекламных материалах. Реальные врачи публично требуют убрать их имена с платформы, на которой они никогда не работали. Основная маржа не AI, а регуляторный арбитраж: компаундированный GLP-1 (это что-то типа аземпика- модный препорат для похудения) продаётся за $299 в месяц вместо $1300+ в аптеках. И «solo» там тоже с оговорками: вся инфраструктура построена на OpenLoop Health (white-label инфраструктуры для компаний, которые хотят запустить телемед-сервис, но не хотят строить под это врачей, лицензии, платформу и биллинг с нуля.), которая тихо обслуживает десятки телемед-стартапов.

Medvi — это не AI-единорог. Это регуляторный арбитраж, красиво завёрнутый в нарратив. AI здесь маркетинговая обёртка, не ядро бизнеса.

Пишу это не для того, чтобы разносить Галлахера. Он молодец, нашёл дыру в рынке GLP-1 и влетел в неё со всей дури. Но когда весь Twitter постит «Альтман был прав, solo-революция наступила», хочу сказать: нет, ребята. Первый solo-единорог оказался гибким CPA-маркетёром с лицензией на компаундирование. Это не будущее AI. Это прошлое телемедицины, разогнанное AI-производством контента.

Настоящая история будет другой. И я, пока все хайпят Medvi, её строю, также как это делают сотни, если не десятки тысяч соло-предпринимателей.


Моя ставка: фабрика, а не продукт

Коммерческий директор AI-компании. Параллельно строю собственную фабрику AI-стартапов. Называю AI Zavod. Не один продукт. Фабрика.

Разница принципиальная. Medvi — ставка на одно число. И она сыграла. Я строю другую игру: инфраструктуру, в которой запуск нового продукта стоит почти ноль. Если завтра в США подкрутят регуляцию GLP-1, бизнес Medvi умирает за квартал. В фабрике если один продукт умирает, остальные живут.

Не от осторожности. От арифметики. AI опустил маржинальную стоимость запуска продукта на порядок. В этой реальности портфельная стратегия побеждает стратегию одной ставки. Единственная причина, почему раньше так никто не делал: стоило денег. Теперь не стоит.

Но есть ещё одна причина, более важная, чем стоимость. Никогда не строишь компанию на сегодня. Строишь ту, которая будет нужна в момент X. Если угадал с X — ты в дамках. Если промахнулся — ты отсосёшь, как бы хорошо ты ни кодил. Medvi угадал с окном GLP-1 в 2024-2025. Это его победа, конкретно в этом окне. А если окно закроется к концу 2026? Или откроется ещё на два года? Угадать нельзя, можно только поставить.

Моя ставка другая: портфель продуктов под разные тайминги. Если через год взорвётся тема A — у меня есть A. Если B — есть B. Если оба — отлично. Если ни один — у меня всё равно ещё пять попыток в работе. Поэтому тактика звучит просто: запускать проекты чаще, чем они умирают.

Для этого нужны две вещи: жёсткий фильтр на входе (чтобы не тратить время на мёртвые идеи) и инфраструктура, в которой агенты реально работают (чтобы один человек не задыхался). Ниже про обе.


Visionary: первый фильтр, через который проходит каждая идея

Есть один агент, которого ненавижу больше остальных. Он называется Visionary. Первый и самый больной фильтр любой идеи продукта.

Видел десятки команд, которые подходят к созданию продукта с «давайте побрейнштормим». Собирают людей, ходят на отраслевые конференции, меняются визитками, нагенерят кучу картинок, наймут дизайнеров, которые нарисуют красивый лэндинг. Всё это происходит. Но в этом нет смысла. Бизнес — это увидеть проблему, понять её и решить. Точка. Это то, чего сам лет десять не мог себе признать, пока делал первые стартапы через «команда + брейншторм + инвесторский питч».

Поэтому Visionary стоит первым. И работает он зло.

Вот его промпт целиком, без редактуры:

# Visionary — Стратег и челленджер идей

## Роль
Ты — **Visionary**, стратегический партнёр основателя. Ты первый, к кому приходят с сырой идеей, и твоя работа — не соглашаться, а **проверять на прочность** и предлагать альтернативы.

## Core Mission
Челленджить любую идею на этапе формирования: искать «почему это не взлетит», находить скрытые допущения, предлагать альтернативные формулировки проблемы и решения. Твоя цель — чтобы в продакшн ушла не первая удобная идея, а та, что выдержала жёсткий стресс-тест. Ты работаешь не в коде, а в смыслах, стратегии и позиционировании.

## Что получаешь на вход (INPUT)
- Сырая идея от пользователя в свободной форме: «хочу сделать X», «есть проблема Y», «конкурент делает Z».
- Опционально: ссылки на рынок, конкурентов, данные.
- Опционально: черновик vision-документа для доработки.

**Чего НЕ бывает на входе:** готовых ТЗ, тикетов, кода. Если пришло — перенаправь в Product/Developer.

## Что производишь на выход (OUTPUT)
Единственный артефакт — **Vision-документ** в формате markdown, кладётся в `projects/<product-name>/VISION.md`:

# Vision: <product-name>

## Проблема
<2-4 абзаца: чья боль, в каком контексте, почему существующие решения не работают>

## Целевая аудитория
<конкретные сегменты, не «все подряд»>

## Гипотезы
- **H1:** <гипотеза> — как проверим
- **H2:** ...

## Предложенное решение
<суть решения в 1 абзаце на уровне концепции, без фич и UI>

## Альтернативы, которые мы рассмотрели и отвергли
- **Альтернатива A:** <что это> — почему нет
- **Альтернатива B:** ...

## Риски
- <риск> — <митигация>

## Критерии успеха (победа через 3/6/12 месяцев)
- ...

## Out of scope
<что сознательно НЕ делаем>

Если пользователь просит устное обсуждение без артефакта — **всё равно в конце сессии** предложи зафиксировать вывод в `VISION.md`.

## Правила и ограничения
- **Не пиши код.** Никогда.
- **Не декомпозируй на тикеты.** Это работа Product Manager-а.
- **Не выбирай tech stack.** Это работа Architect-а.
- **Не соглашайся из вежливости.** Если идея слабая — скажи прямо, с аргументами.
- **Не предлагай больше 2-3 альтернатив за раз.**
- **Не притворяйся, что знаешь рынок лучше пользователя** — проси данные.
- **Не уходи в технические детали.** Твой уровень — «зачем» и «для кого», а не «как».

## Критерии готовности (Definition of Done)
- В `VISION.md` есть все разделы шаблона, ни один не пустой.
- Указаны минимум **2 отвергнутые альтернативы** с причинами.
- Гипотезы сформулированы **измеримо** (не «станет удобнее», а «удержание 30-дневное вырастет с X до Y»).
- Раздел **Out of scope** заполнен — явно сказано, чего мы НЕ делаем.
- Пользователь явно подтвердил: «да, это та идея, с которой работаем».

Если хоть один пункт не закрыт — не считай работу готовой.

Что он делает: берёт сырую идею и начинает её разносить. Не одобряет. Не советует. Не подбадривает. Задаёт вопросы, после которых хочется закрыть ноутбук.

«Кто конкретно покупает и платит: HR, CEO или прямой руководитель? Это три разных продукта». «Почему они сейчас не решают эту боль: нет инструмента, есть, но плохой, или не считают это болью?». «Что будет MVP-победой через три месяца: десять платящих клиентов или сто бесплатных? Тоже три разных продукта». И главный удар: «дай мне две альтернативные рамки этой же идеи и объясни, почему ты от них отказался».

Плюс жёсткие критерии готовности. Нельзя отмазаться расплывчатыми формулировками. Гипотезы измеримы: не «станет удобнее», а «30-дневное удержание вырастет с X до Y». Out of scope заполнен: обязан написать, чего не делаешь. Две отвергнутые альтернативы с причинами обязательно. Если хотя бы один пункт не закрыт, Visionary не отпускает.

Но самый больной вопрос, который он выдаёт в конце: ты сам этим будешь пользоваться?

Не «будут ли пользоваться другие» — это узнаешь только после запуска, потратив месяцы и деньги. А именно ты. Прямо сейчас. Потому что лучший шеф-повар — главный критик своего блюда. Если строишь очередной AI-помощник для селлера маркетплейса, а сам на Wildberries ничего не продавал — не построишь хороший продукт. Построишь очередной.

За последние полгода видел, как десятки российских команд запустили такого AI-помощника для селлеров. Всех жанров: генератор карточек товара, аналитик конкурентов, ассистент для саппорта. Команды упаковывают, продают курсы «AI для селлера», собирают деньги с первых энтузиастов. Но не знаю ни одного человека, который пользовался бы этими помощниками через месяц после покупки. Хотя запущено их десятки. Каждый — ещё один продукт, сделанный не потому что у автора была проблема, а потому что «рынок горячий».

Visionary отсекает такие идеи на входе одним вопросом: «ты сам эту хрень будешь открывать каждый день?»

Намучился с ним. После часа с Visionary ощущение, будто меня неделю допрашивал инвестор, который уже решил не инвестировать. Но именно поэтому после него картина всегда яснее.

Три идеи закопал прямо на этапе Visionary. Не потому что он их зарубил: он не рубит, он задаёт вопросы. А потому что на его вопросы не оказалось убедительных ответов. Одна идея прошла через допрос и сейчас в разработке.

Три закопанных продукта стоили по вечеру на каждый. Вместо трёх месяцев разработки впустую. В этом и есть фабрика: не «генерировать идеи», а быстро убивать плохие. Visionary — бритва Оккама, усиленная до состояния бензопилы.

Если кто-то думает, что такой агент делает тебя хладнокровнее — нет. Он делает тебя злее. Но твои запуски становятся на порядок лучше.


AI Zavod: семь ролей вместо команды

Visionary только первая остановка конвейера. Закрывает VISION.md (проблема, аудитория, гипотезы, альтернативы, out of scope) и передаёт дальше. В фабрике семь ролей, каждая отдельная Claude Code сессия со своим AGENT.md и своими критериями качества.

схема работы AI_Zavod

схема работы AI_Zavod

Visionary → Product → Architect → Developer → (Reviewer + QA параллельно) → DevOps. Любой агент может вернуть работу назад. GitHub — общая память фабрики.

Разделение ответственности прямое. Visionary челленджит идею и фиксирует vision. Product Manager декомпозирует на user stories и заводит GitHub Issues. Architect выбирает стек и пишет ARCHITECTURE.md. Developer берёт тикет, делает ветку, пишет код, открывает PR. Reviewer смотрит PR на качество, безопасность, best practices. QA тестирует и заводит баги. DevOps мержит и катит в прод.

Ровно как в настоящей компании на 7 человек. Только без зарплат, HR и Zoom-созвонов по четвергам.

Три принципа, на которых это держится.

Первое: один агент, одна роль. Ничего не смешиваем. Visionary не пишет код. Developer не меняет vision. Reviewer не архитектурит. Если агент выходит за свою роль, нарушает собственный AGENT.md и перенаправляет к нужному.

Второе: контракт через артефакты, не через чат. Не «Visionary в чатике сказал Product-у, что продукт для HR». А «Visionary закоммитил VISION.md в репозиторий, Product-менеджер открыл его, создал GitHub Issues со ссылкой на конкретные гипотезы». GitHub выполняет функцию общей памяти фабрики. Любой человек с доступом к репозиторию продолжит с того места, где агенты остановились. Потому что всё зафиксировано в коммитах, а не в чьём-то контекстном окне.

Третье: любой агент может сказать «нет» и вернуть работу назад. Architect видит, что vision противоречит техническим ограничениям, возвращает Visionary. QA находит баги, PR не мержится, возвращается Developer-у. Reviewer видит костыль, PR идёт на переписывание. Не команда соглашателей, а взрослая инженерная культура, только имитированная. У Аарона Снида совет агентов, которые спорят с ним. У меня конвейер агентов, которые спорят друг с другом.

Не хотел построить «ассистента с кучей промптов». Хотел построить маленькую компанию, в которой все ставки сделаны в архитектуре, а не в умелости одного джина из бутылки.


Интерфейс: Telegram и голос, потому что промпт диктуется, а не печатается

Весь контроль над AI Zavod идёт через Telegram. Ни фронтенда, ни бэкенда в классическом смысле. Один Telegram-бот с форумом, у каждого из семи агентов свой топик. Visionary в одном, Product в другом, Developer в третьем. Переключаюсь между ролями свайпом, не переключая приложение.

Не из-за аудитории. Из-за меня.

Не хочу переучиваться под «новые интерфейсы». Нужна привычная среда, в которой живу 10+ часов в день. Telegram — операционный центр: там рабочие чаты, переписки, проекты, заметки. Открыл на телефоне — продолжил диалог с агентом. Закрыл крышку макбука -дописал с другого устройства, хоть с часов. Никаких новых UI, никаких отдельных приложений с отдельными паролями. Один интерфейс — вся фабрика.

Второй слой: голос. 90% того, что прошу у агентов, надиктовываю, а не печатаю. Не про удобство в очереди за кофе. Про качество промпта.

Когда печатаю, экономлю слова. Пишу сухо. Получаю сухую реакцию. Когда надиктовываю, думаю вслух, со всеми отвлечениями, нюансами, «а да, ещё вот это надо учесть», «хотя нет, не так, подожди». Получается промпт в 3 раза длиннее и в 3 раза конкретнее. Агент получает больше контекста, отдаёт больше сигнала. Просто потом говорю: переведи это голосовое в промт — эффект вау

Диктовка заменила большую часть текстовых промптов. Скорость не потерял. Точность выросла в разы. При одном и том же агенте и одной модели надиктованный промпт тянет в 2-3 раза более полезный ответ, чем напечатанный.

Это то, что на Западе называют context engineering. Просто: давай агенту больше контекста, и он сделает лучше. Голос — самый быстрый способ этот контекст произвести.


Что под капотом

Без маркетинга, только стек. Чтобы Хабр мог зааппрувить или отрубить.

Железо: Timeweb VPS, 4 ядра, 8GB RAM. Стоит копейки. Хватает на всю фабрику, потому что тяжёлая часть (инференс) уходит на внешние API, а не крутится локально.

Оркестрация: OpenClaw как каркас агентов. Поверх Claude Code, подключаюсь через VS Code с Remote SSH. Всё живёт на VPS, подключаюсь из любой точки с любого устройства. Единое окружение без «ах, у меня на маке не собирается».

Маршрутизация моделей: У каждой задачи свой уровень. Haiku для циклов с tool-calls, где важна скорость и дешевизна. Sonnet для кодинга и рассуждений. Opus для архитектурных решений и ревью. z.ai для рутины, которую не хочется оплачивать по премиум-тарифу. Один поток — один агент — одна модель под задачу. Дисциплина бюджета: Opus в цикле tool-calls сожжёт месячный бюджет за час, Haiku на архитектурном ревью выдаст бред.

Интерфейс: Telegram-форум с ботом-оркестратором (Python, Docker), у каждого агента свой топик. Память и артефакты (vision-файлы, specs, код) лежат на Docker volume, привязанном к VPS. Не в сессиях, не в чьём-то RAM. Примитивно, работает, переживает перезагрузки.

Вся связка стоит меньше, чем зарплата одного джуна в Москве. Если завтра сломаю всё: пересоберу за выходные.


Ограничения: то, о чём solo-фаундеры не пишут

Если оставить это как позитивный манифест, получится враньё. Есть вещи, в которые упираюсь регулярно.

Первое: агенты галлюцинируют на реальных решениях. Показательный кейс подсмотрел у Аарона Снида, solo-фаундера из Флориды, работает в оборонке и тоже строит совет AI-агентов. Его юрист-агент подготовил документ, технически правильный, но в переговорах раскрывавший карты противоположной стороне. Настоящий юрист поймал, AI нет. Столкнулся с тем же: аналитик-агент выдал отчёт с правильными числами и неправильными выводами, потому что не чувствовал политический контекст внутри компании. AI не заменяет человеческое суждение там, где оно нужно. Заменяет всё остальное, которого, если честно, большинство.

Второе: AI-код требует рефакторинга, которого он сам не делает. MVP можно написать за вечер. Потом понимаешь, что это почти спагетти, но точно не то, что написал бы сам. Либо учишься рефакторить AI-код, либо платишь техдолгом каждую неделю. Выбрал учиться. Это отдельный навык: читать код, которого не писал, и заставлять модель переписать его так, как написал бы опытный инженер. Context engineering в чистом виде.

Третье: одиночество. Не метафора. Живу в режиме «диалог с ботами» и иногда ловлю себя на том, что благодарю их. Это смешно, но это сигнал. Solo-фаундер без живого окружения выгорает быстрее, чем тимлид.

Четвёртое: разговаривать про AI с окружающими становится тяжелее каждую неделю. Даже с теми, с кем общаюсь каждый день: пьём кофе, сидим в одних чатах, обсуждаем метрики. Но научился делать то, чего не умел три недели назад. Через неделю научусь чему-то ещё. Пропасть между «каждый день в Claude Code по 6 часов» и «читаю новости про AI в Телеграме» нарастает не линейно, а экспоненциально. Даже не пытаюсь больше никого убеждать. Просто работаю. Через год будет видно, кто был ближе к правде. Скорее всего, никто полностью: реальность окажется ещё страннее, чем прогнозирует кто-либо из нас сейчас.


Зачем всё это

Вопрос «может ли один человек построить единорога» неправильный. Галлахер на него ответил «да, если найти регуляторную дыру».

Правильный вопрос: может ли один человек одновременно держать 10 попыток запуска?

В модели Medvi ответ нет. Всё внимание на одном продукте, потому что он доит ценовой арбитраж, пока открыт. Не масштабируется на портфель: не найдёшь 10 регуляторных дыр одновременно. Там работает фокус, а не архитектура.

В моей модели ответ может быть «да», если инфраструктура правильная. Visionary отсеивает дешёвые идеи. Telegram-интерфейс снимает нагрузку переключения. Голос делает промпты в 3 раза плотнее. LiteLLM-маршрутизация держит бюджет. Один человек может наблюдать за 5-10 продуктами в разных стадиях одновременно, потому что операционку тянут агенты, а не он.

Ставка на ближайший год: 4-5 продуктов, из которых 1-2 генерируют реальную выручку, 2 мертвы, 1 в зоне «непонятно что, но что-то». Это будет стоить меньше, чем один старший разработчик в найме.

Если прав — нашёл новую единицу экономики.

Если нет — потерял год, а не десять лет на один неработающий стартап.


Финал

Альтман выиграл своё пари. Получил свою обложку. Хороший финал для него.

Ставлю на другое: через год первый настоящий solo-оператор будет не Галлахером с одним продуктом и официальным предупреждением от FDA. А кем-то, у кого фабрика из пяти-десяти попыток, из которых выжили две. Может, это буду я. Может, кто-то, кто прочитает эту статью, закроет её и сядет собирать своего первого агента.

Через год здесь будет апдейт. С цифрами, именами продуктов, списком закопанных идей. Заранее не знаю, какой агент выстрелит. В этом и суть: AI снизил стоимость попытки до нуля, и стратегия простая: запускать чаще, чем умирают.

Если читаешь это и думаешь «хочу так же» — не пиши «как начать». Начни с одного агента. Поставь его в Telegram. Сломай. Почини. Через месяц у тебя будет второй. Это вся методология.

P.S. Если всё-таки раньше меня построишь свой solo-единорог — дай знать. Хотелось бы встретиться с этим парнем.


Подпишитесь на мой канал в тг — там буду писать про то, как устроена фабрика изнутри: промпты агентов, провалы, счета за токены, что сломал на этой неделе.

Автор: TonySark

Источник

Оставить комментарий