Архив рубрики ‘ocr’

Как техлид без навыка кодинга руками собрал Telegram-систему закупок с OCR, модерацией и безопасным деплоем

Я технический лидер. Обычно моя работа не в том, чтобы писать код руками, а в том, чтобы запускать сложные hardware/software-проекты с нуля, собирать архитектуру, принимать ключевые технические решения, выстраивать команду и доводить систему до MVP в условиях неопределённости. Я работаю на стыке механики, электроники, разработки и AI, связывая это в единый контур. При этом я […]

Стопроцентное распознавание

У истории про «элитный вайбкодинг», вызвавшей заметный интерес широких айтишных масс, есть не менее интересная предыстория. Проектному управлению посвящается. Низвержение в Мальстрем Если никогда не бывали в Гонконге

Оцифровываем сырую документацию компании с помощью ИИ локально! DeepSeek-OCR + Qwen 1.5

Недавно получил задачу сделать автоматизированную оцифровку характеристик из паспортов товаров в БД, а не изменение параметров вручную в ERP. Я подумал, было бы здорово поделиться, как я это сделал, с вами на Хабре! Базовые задачи: Нужно, чтобы это все работало локально Система должна принимать разные форматы (.doc, .pdf, .png) Возможность создавать динамические таблицы, куда ИИ […]

Reasoning CV-модели OpenAI не смогли посчитать монеты

Всем привет! Меня зовут Александр, я COO в SaaS-платформе аналитики данных. Последний год активно изучаю внедрение AI-решений в кросс-функциональные процессы. Делюсь полезными материалами, которые считаю стоят внимания. В основном про AI, изменение процессов, тренды и продуктовое видение. У себя в телеграм-канале делюсь сжатыми и структурированными саммери статей. Сегодняшний перевод — OpenAI o3 and o4-mini: Multimodal […]