Архив рубрики ‘claude’

LLM бенчмарк «Испытание Дали»

Обложка нарисована в ChatGPT Image-2 Помните анекдот? — Что вы умеете лучше всего? — Я очень быстро считаю. — Сколько будет 758×652÷9? — 22! — Но это же неправильно! — Зато очень быстро.

Мысли об одной продуктовой ошибке подавляющего большинства GenAI компаний

Мало кто имеет возможность обучить конкурентноспособную LLM с нуля. Тем не менее спрос на использование больших языковых моделей — огромный. Такая ситуация на рынке дает возможность организациям продавать доступ к LLM’кам и продуктам вокруг них на выгодных условиях. Чтобы извлечь максимум пользы, организации берут деньги с пользователей по двум разным моделям монетизации: Подписочная

Я автоматизировал свою работу на 70%. Вот что осталось в тех 30%

Я занимаюсь внедрением AI в бизнес. Тридцать с лишним проектов за последние годы: чат-боты, RAG-системы, автоматизация документооборота, аналитика. Каждый раз объясняю клиентам, что нейросеть возьмёт на себя рутину и освободит время для важного. В какой-то момент стало неловко. Я продаю автоматизацию другим, а сам сижу и руками пишу письма, собираю отчёты, ресёрчу конкурентов. Сапожник без […]

Как мы добавили ИИ-ассистента в рабочий чат и что из этого вышло

У нас небольшая IT-компания — SaaS-продукт, 5 разработчиков, 4 менеджера, CEO. Обычный стек: PHP + Vue, MySQL, GitHub, Telegram для коммуникации. Ничего революционного. Мы занимаемся автоматизацией бизнес-процессов. Но в какой-то момент поймали себя на мысли: мы автоматизируем чужие рабочие процессы, а свои — нет. Внутри компании всё держится на CEO, который вручную отвечает на вопросы, […]

Написал задачу, закрыл ноутбук: агент спланировал, поспорил с ревьюером и прислал PR в Telegram

Ты пишешь задачу. Агенты планируют, пишут код, делают ревью, проверяют безопасность и присылают уведомление в Telegram. Ты открываешь готовый результат. Именно это делает AIF Handoff. Но чтобы понять, почему это работает, нужно разобраться с тем, что обычно идёт не так. Часть 1. Почему вайб-кодинг ломается Давайте рассмотрим эволюцию вайб-кодеров Стадия 1. Лотерея

Как я научил Claude Code работать бизнес-аналитиком по руководству BABOK. Вот что получилось

AIналитик (AInalyst) — это AI-ассистент, который работает рядом с вами как опытный коллега бизнес-аналитик. Он прекрасно знает методологию BABOK v3, умеет строить карты стейкхолдеров, планировать интервью и обрабатывать его результаты: собирать требования, трассировать и приоритизировать их, оформлять артефакты. Вы описываете задачу своими словами — AIналитик предлагает следующий шаг, задаёт уточняющие вопросы и делает работу. BABOK […]

AI-суперапп – главный тренд 2026 по версии Forbes. Что мы видим из GPTunneL с позиции 2 млн пользователей

В декабре я рассказал на Хабре, как GPTunneL вырос от прототипа до 1,5 млн пользователей. С тех пор нас стало 2 млн. Подумал – пора рассказать, что мы делаем сейчас и куда идём. Хабр для этого хорошее место. Если коротко: строим и обучаем собственную модель GROM, развиваем GraphRAG, Creative Lab, vibe-coding, работаем над оркестрацией 100+ моделей […]

Как CEO, CTO и CIO за 8 часов собрали ИИ-директора, который умеет держать позицию под давлением

Представьте: три топ-менеджера из крупных компаний садятся писать код. Не ставить задачи команде, не согласовывать архитектуру — а сами, руками, за восемь часов собрать работающую систему. И не просто систему, а ИИ-директора, который не сломается под давлением CEO. Спойлер: получилось

Конец эры чат-ботов или как Claude Managed Agents меняет правила игры для бизнеса

8 апреля 2026 года компания Anthropic

Как я сократил рабочий день до 4 часов и вырос в должности

123.5