бенчмарк

Архив рубрики ‘бенчмарк’

08
Апр
2026

Один скилл, четыре модели — что может пойти не так

На GitHub лежат сотни AI-скиллов. Скилл для code review, скилл для дебага, скилл для обработки PDF, скилл для анализа безопасности. Установил в Cursor или Claude Code — и твой AI-ассистент стал умнее. Звучит как npm install: поставил пакет, он работает. Но скилл — не пакет. Это текстовый файл с инструкциями, который читает языковая модель. А […]

Опубликовано в AI skills, ai-агенты, claude, deepseek, gemini, gpt, llm, tool calling, бенчмарк, кроссмодельное тестирование

08
Апр
2025

Tinder VS LLM

Как мы придумали бенчмарк для LLM в дейтинге Привет, я — дата-сайентист, и в свободное время моими двумя главными хобби являются дейтинг и ведение блога про ML. Казалось бы, что общего у поиска идеального мэтча в Tinder

Опубликовано в llm-приложения, tinder, бенчмарк, дейтинг, свидания

Архив рубрики ‘бенчмарк’

Один скилл, четыре модели — что может пойти не так

Tinder VS LLM

Рубрики

Случайные статьи

Архивы