обработка естественного языка

Архив рубрики ‘обработка естественного языка’

25
Апр
2026

От каши к структуре: гибридная AI‑система для обработки свободного текста

Я занимаюсь проектом, где нужно из свободных текстов на естественном языке вытаскивать структурированные данные. Не разово — постоянно, по мере поступления. За несколько месяцев я перепробовал регулярки, чистый LLM и в итоге пришёл к гибриду. Ниже расскажу, что из этого всего вышло: архитектура, промпты, трудности и неочевидные решения. Стек: Python 3.12, Ollama + Qwen 2.5 (всё локально), YAML как формат хранения, SHA256 для дедупликации, Jinja2 для шаблонизации промптов. Проект называется Svyazi

Опубликовано в llm, python, qwen, yaml, гибридная архитектура, нетворкинг, нормализация, обработка естественного языка, поиск по профилям, структурирование данных

Архив рубрики ‘обработка естественного языка’

От каши к структуре: гибридная AI‑система для обработки свободного текста

Рубрики

Случайные статьи

Архивы