Llm - страница 3

Архив рубрики ‘llm’

30
Апр
2026

Как закешировать интеллект: LLM Cache в поиске Яндекс Лавки

Опубликовано в catboost, llm, llm-архитектура, доставка, машинное обучение

30
Апр
2026

Из backlog в ТЗ: как мы с помощью AI превращаем клиентские запросы в исполнимые постановки на доработку системы

Мы в «Первой Форме» развиваем BPM-систему на базе low-code для автоматизации бизнес-процессов: документооборота, CRM, HR, PM и Service Desk. Мы работаем с B2B-клиентами, у которых платформа живет внутри реальных процессов компании: согласований, заявок, договоров, кадровых маршрутов, сервисных сценариев и внутренних регламентов. В такой модели у нас постоянно появляется поток запросов на доработку системы.

Опубликовано в ai, BPMS, enterprise, llm, pipeline, автоматизация, бизнес-процессы, внедрение, обновления системы

29
Апр
2026

Я просил Claude перестать мне льстить. 16 апреля получил. Беру свои слова назад

16 апреля Anthropic выкатила Claude Opus 4.7. На self-reported бенчмарках — 12 побед из 14. SWE-bench Verified +6.8, MCP-Atlas +14.6, SWE-bench Pro +10.9. Цена та же, 25 за миллион токенов. Через 24 часа

Опубликовано в ai coding, anthropic, claude, llm, Opus 4.7, sycophancy, бенчмарки, Разработка

29
Апр
2026

Спецификация, ворота, метрики: как SENAR закрывает вход и выход задачи

Опубликовано в ai-разработка, claude code, llm, senar, tausik, инженерные практики, методология разработки, спецификация задачи, управление качеством

29
Апр
2026

10 актуальных RAG-подходов: какие реально полезны и когда их применять?

Всем привет, на фоне обновлений в LLM-стеке за последний год, решил собрать практический список RAG-подходов, которые реально используются в продакшене на основе моего опыта и того что я изучал в других кейсах.

Опубликовано в ai-разработка, graphrag, hybrid search, llm, llm-модели, multimodal, rag ai, rag pipeline, retrieval augmented generation, vector search

28
Апр
2026

Настроил ИИ-агента прямо в редакторе Zed: подключил Gemini и gopls, чтобы агент понимал код и реально помогал писать

За последние десять лет инструменты разработки существенно ускорили мою работу, но не изменили её сути: до недавних пор я тратил большую часть рабочего времени на написание кода и тестов. Но я смог это изменить, когда начал активно осваивать возможности ИИ. Меня зовут Александр Зайцев. Я Go-разработчик в команде Delivery компании «Флант» и работаю над werf и Deckhouse Delivery Kit (DevSecOps). […]

Опубликовано в AI driven development, ai-агенты, DevOps, gemini flash, llm, zed, Блог компании Флант, Искусственный интеллект, Программирование, продуктивность

27
Апр
2026

Senior на бумаге, Junior в рантайме: как я тестировал локальные LLM на 120B параметров в Greenfield-проекте

Недавно я задался вопросом: можно ли организовать полноценный agent dev loop (то есть, цикл разработки агентов), используя только локальные модели? Идея заманчивая — гонять агента по задачам бесконечно, не оглядываясь на счета от OpenAI или Anthropic и не переживая за утечку кода. Чтобы проверить это, я выделил кластер и столкнул лбами три тяжеловеса из мира open source. Спойлер: архитектурно они все — Senior‑разработчики, но когда дело доходит […]

Опубликовано в agent dev loop, greenfieldproject, llm, Open source, qwen, агенты, цикл разработки агентов

27
Апр
2026

LLM бенчмарк «Испытание Дали»

Обложка нарисована в ChatGPT Image-2 Помните анекдот? — Что вы умеете лучше всего? — Я очень быстро считаю. — Сколько будет 758×652÷9? — 22! — Но это же неправильно! — Зато очень быстро.

Опубликовано в claude, deepseek v4, gemini, gigachat, gpt-5, llm, prompt-engineering, yandexgpt 5, бенчмарки, Искусственный интеллект

27
Апр
2026

Новый LAMP, или почему ваш Agent Pipeline — это Apache в 2006 году

Помните LAMP? Linux, Apache, MySQL, PHP. 2006 год. Резюме сисадмина без LAMP не рассматривали. Курсы, сертификаты, форумы. Все учили стек. Мало кто спрашивал: а задачу-то как решать? Стек и есть решение. Поставил LAMP, залил WordPress, работает. Следующий. Откройте Хабр в 2026. “Собираем RAG на PHP за вечер.” “Оркестрация LLM через Redis.” “Agentic RAG Challenge.” “Multi-agent […]

Опубликовано в Design by Contract, developer tools, LangChain, llm, pipeline, rag, методология разработки

26
Апр
2026