LLM бенчмарк «Испытание Дали»
Обложка нарисована в ChatGPT Image-2 Помните анекдот? — Что вы умеете лучше всего? — Я очень быстро считаю. — Сколько будет 758×652÷9? — 22! — Но это же неправильно! — Зато очень быстро.
Обложка нарисована в ChatGPT Image-2 Помните анекдот? — Что вы умеете лучше всего? — Я очень быстро считаю. — Сколько будет 758×652÷9? — 22! — Но это же неправильно! — Зато очень быстро.
Мало кто имеет возможность обучить конкурентноспособную LLM с нуля. Тем не менее спрос на использование больших языковых моделей — огромный. Такая ситуация на рынке дает возможность организациям продавать доступ к LLM’кам и продуктам вокруг них на выгодных условиях. Чтобы извлечь максимум пользы, организации берут деньги с пользователей по двум разным моделям монетизации: Подписочная
Я занимаюсь внедрением AI в бизнес. Тридцать с лишним проектов за последние годы: чат-боты, RAG-системы, автоматизация документооборота, аналитика. Каждый раз объясняю клиентам, что нейросеть возьмёт на себя рутину и освободит время для важного. В какой-то момент стало неловко. Я продаю автоматизацию другим, а сам сижу и руками пишу письма, собираю отчёты, ресёрчу конкурентов. Сапожник без […]
У нас небольшая IT-компания — SaaS-продукт, 5 разработчиков, 4 менеджера, CEO. Обычный стек: PHP + Vue, MySQL, GitHub, Telegram для коммуникации. Ничего революционного. Мы занимаемся автоматизацией бизнес-процессов. Но в какой-то момент поймали себя на мысли: мы автоматизируем чужие рабочие процессы, а свои — нет. Внутри компании всё держится на CEO, который вручную отвечает на вопросы, […]
Ты пишешь задачу. Агенты планируют, пишут код, делают ревью, проверяют безопасность и присылают уведомление в Telegram. Ты открываешь готовый результат. Именно это делает AIF Handoff. Но чтобы понять, почему это работает, нужно разобраться с тем, что обычно идёт не так. Часть 1. Почему вайб-кодинг ломается Давайте рассмотрим эволюцию вайб-кодеров Стадия 1. Лотерея
AIналитик (AInalyst) — это AI-ассистент, который работает рядом с вами как опытный коллега бизнес-аналитик. Он прекрасно знает методологию BABOK v3, умеет строить карты стейкхолдеров, планировать интервью и обрабатывать его результаты: собирать требования, трассировать и приоритизировать их, оформлять артефакты. Вы описываете задачу своими словами — AIналитик предлагает следующий шаг, задаёт уточняющие вопросы и делает работу. BABOK […]
В декабре я рассказал на Хабре, как GPTunneL вырос от прототипа до 1,5 млн пользователей. С тех пор нас стало 2 млн. Подумал – пора рассказать, что мы делаем сейчас и куда идём. Хабр для этого хорошее место. Если коротко: строим и обучаем собственную модель GROM, развиваем GraphRAG, Creative Lab, vibe-coding, работаем над оркестрацией 100+ моделей […]
Представьте: три топ-менеджера из крупных компаний садятся писать код. Не ставить задачи команде, не согласовывать архитектуру — а сами, руками, за восемь часов собрать работающую систему. И не просто систему, а ИИ-директора, который не сломается под давлением CEO. Спойлер: получилось
8 апреля 2026 года компания Anthropic