Архив рубрики ‘llm’

Почему ваше AI-решение не окупается. Фреймворк OpenAI, который все пропустили

OpenAI опубликовали фреймворк, на который мало кто обратил внимание. Исследование OpenAI (да и не только их) показало: компании внедряют ИИ, но часть из них не получает ожидаемого эффекта. В этом фреймворке на мой взгляд обозначены принципы отделяющие посредственные решения от тех которые делают внедрение AI в бизнес эффективным. https://openai.com/index/evals-drive-next-chapter-of-ai/ KPI и OKR остаются бизнес-целями. Evals […]

Evals – гарантия качества и окупаемости ИИ

OpenAI опубликовали фреймворк, на который мало кто обратил внимание. Исследование OpenAI (да и не только их) показало: компании внедряют ИИ, но часть из них не получает ожидаемого эффекта. В этом фреймворке на мой взгляд обозначены принципы отделяющие посредственные решения от тех которые делают внедрение AI в бизнес эффективным. https://openai.com/index/evals-drive-next-chapter-of-ai/ KPI и OKR остаются бизнес-целями. Evals […]

Как не превратиться в «AI-first» компанию без реального использования ИИ. Перевод колонки CEO Runway

Помните тот момент, когда впервые услышали, что ваша компания переходит к модели AI-first?

Оценка прироста производительности труда благодаря использованию ИИ (диалогов с Claude)

Перевод свежей и вызывающей споры статьи об оценке роста производительности разных работ при использовании ИИ.

ADSM: каталоги верхнего уровня

Когда мы работаем в паре с LLM-агентом, нужно принимать во внимание природу нашего «партнёра«. Агент опирается только на тексты, действует в пределах ограниченного контекста и не удерживает долгосрочную историю. Поэтому особенно важным становится то, какие тексты мы ему предоставляем и как они структурированы. Ниже — компактная, прикладная схема верхнего уровня, которую можно использовать в собственных […]

Зашкаливающая бюрократия на стыке проектов двух крупных банков — мой опыт

Я руководитель проектов, работаю с крупными корпоратами и банками первой пятёрки. Самый ад — это когда проект на стыке двух таких банков. У меня есть живой пример ) На этом проекте: Юристы и безопасники из двух банков 4 месяца гоняли договор по кругу. Надо было как-то их договорить и всё-таки начать работать. Договор был рассчитан […]

HalChatLocalAI: как я встроил офлайн-ИИ прямо в мессенджер

Большинство ИИ-ассистентов работают в облаке. А я сделал локальный — прямо внутри мессенджера HalChat. Большинство современных ИИ-ассистентов работают в облаке, требуют подключения к серверам и не дают контроля над данными. Я решил исследовать, возможно ли встроить искусственный интеллект прямо в мессенджер, чтобы он работал локально прямо в браузере, офлайн и под управлением самого пользователя.

Открываю карты: 12 лет работы в ФНС

Приветствую всех читателей Хабра! Настал день, когда я снял «оковы» и могу открыто говорить о том, чем я занимался на протяжении последних 12 лет. Ранее я опубликовал 3 статьи, в которых делился опытом гуманитария при работе с нейронными сетями, в том числе честно рассказал о своем опыте вайбкодинга, как я применяю LLM в повседневной жизни, […]

ADSM: видеочат на WebRTC через Codex-агента

Мои родители и вся моя семья живут в Риге, а большинство наших родственников — в России и Украине. Когда привычные мессенджеры начинают работать с перебоями, хочется иметь простой и независимый способ связи. Самый простой способ из мне известных — WebRTC. В рамках развития собственного понимания тонкостей парной разработки программ с участием LLM-агентов я решил создать […]

Мы были между двух огней

Всем привет! Меня зовут Артём Матюшечкин, я менеджер разработки из команды Толк.ИИ в продукте Контур.Толк — это сервис видеоконференцсвязи для общения и работы. Наша команда сделала суммаризацию, обновила и ускорила сегментацию виртуальных фонов, внедрила шумоподавление в продукт. В этой статье поделюсь опытом управления такой командой, которая пыталась одновременно уместить в себе требования бизнеса и технологий.

123.6