Генеральный директор «Технологики» Олег Кокорин дал комментарий для обзора TAdviser 2026, посвящённого рынку интеллектуальной обработки документов. В обзор вошла часть экспертных тезисов, а в этой статье мы публикуем расширенный взгляд на то, как меняется IDP, почему одного OCR уже недостаточно и какие решения будут востребованы в 2026–2027 годах.
Ещё несколько лет назад интеллектуальную обработку документов часто воспринимали как более продвинутый OCR: система должна была распознать текст на скане или PDF и передать его дальше.
Сегодня такой подход уже не закрывает большинство бизнес-задач.
Современный IDP-пайплайн обычно состоит из нескольких уровней. На базовом уровне работают OCR и ML-модели: они извлекают текст, координаты элементов, структуру страницы и показатель уверенности по каждому фрагменту. Затем подключаются алгоритмы восстановления структуры документа: система определяет таблицы, строки, колонки, заголовки, подписи, связанные поля и повторяющиеся блоки.
После этого начинается не менее важный этап — логические проверки и валидация. Система должна понимать, сходится ли сумма строк с итоговой суммой, заполнены ли обязательные поля, совпадают ли даты, корректно ли извлечены номера документов, не нарушена ли структура таблицы.
И только после этого имеет смысл подключать LLM — там, где они действительно дают дополнительную ценность.
Большие языковые модели хорошо работают в задачах, где важен контекст. Например, когда документ не имеет стабильного шаблона, поле может называться по-разному, текст распознан с ошибками, а нужная информация находится не в фиксированной зоне страницы, а внутри произвольной формулировки.
В таких сценариях LLM помогают:
Но LLM не должны работать в IDP как свободный генератор текста. В обработке документов критично, чтобы модель не «догадывалась», а возвращала данные в заданной структуре, с понятными ограничениями и проверками.
Поэтому рынок движется к более предсказуемому использованию LLM: схемам вывода, автоматической валидации результата, контролю уверенности, проверке бизнес-правил и обработке исключений.
Главный тренд здесь — борьба с галлюцинациями. Чем меньше у модели пространства для фантазии и чем больше контроля над результатом, тем выше доверие к IDP-системе.
Настоящая ценность IDP появляется не в момент распознавания текста, а после него.
Бизнесу обычно нужно не просто «прочитать PDF». Ему нужно получить проверенные данные, которые можно использовать дальше: в бухгалтерии, логистике, юридическом документообороте, HR, закупках, compliance, клиентском сервисе или управленческой отчётности.
Поэтому IDP всё чаще становится частью более широкой автоматизации. Документ загружается в систему, распознаётся, проходит валидацию, отправляется в BPM или ECM, получает статус, попадает на ручную проверку при необходимости, а затем передаёт данные в 1С, ERP, CRM, HR-платформу или другую корпоративную систему.
В такой архитектуре важно не только качество извлечения данных. Не менее важны:
Именно поэтому один и тот же OCR-движок может давать похожее качество у разных игроков, но выигрывает тот поставщик, который быстрее и дешевле встраивает решение в реальные процессы заказчика.
Спрос на интеллектуальную обработку документов растёт в разных сегментах, но причины внедрения отличаются.
В госсекторе и крупном бизнесе IDP востребован из-за больших объёмов документооборота, строгих регламентов, требований к безопасности, необходимости закрытого контура и сложных интеграций. Для таких заказчиков важно, чтобы решение работало внутри существующей инфраструктуры и соответствовало внутренним правилам обработки данных.
В сегменте малого и среднего бизнеса мотивация другая. Здесь чаще нужен быстрый запуск и понятный экономический эффект. SMB-компании обычно начинают с более простых сценариев: обработка счетов, первичных документов, заявок, кадровых документов, актов или спецификаций.
Для среднего бизнеса особенно интересны точечные IDP-модули, которые закрывают конкретную рутинную операцию и быстро показывают окупаемость. Например: автоматическое извлечение данных из счетов, сверка спецификаций, обработка входящих заявок, подготовка данных для 1С или CRM.
Формат внедрения сильно зависит от масштаба и требований компании.
Для enterprise-заказчиков приоритетом остаётся интеграция в существующие корпоративные системы: СЭД, ECM, BPM, HR-платформы, ERP и другие внутренние контуры. Для них IDP должен быть не отдельным приложением, а «невидимым» технологическим слоем внутри уже работающей инфраструктуры.
В этом сегменте также часто востребованы локальные on-premise-решения. Причины понятны: информационная безопасность, конфиденциальность данных, регуляторные ограничения и нежелание передавать чувствительные документы во внешние сервисы.
SMB чаще выбирает другой путь. Здесь востребованы узкоспециализированные модули или микросервисы, которые решают конкретную задачу: обработку счетов, первичных документов, заявок, актов или других повторяющихся документов. Интеграция обычно проще: например, передача обработанных данных в 1С или другую учётную систему.
SaaS-модель остаётся востребованной там, где нет жёстких требований к хранению данных и критична скорость внедрения. Такой подход хорошо подходит для типовых процессов и компаний, которым важно быстро проверить экономический эффект.
В целом наиболее универсальной становится модульная архитектура. Она позволяет использовать решение как самостоятельный инструмент в SMB и одновременно встраивать его в сложные корпоративные контуры крупных заказчиков.
Для российского рынка импортозамещение остаётся одним из ключевых факторов развития IDP.
Это особенно заметно в госсекторе и у компаний с повышенными требованиями к корпоративным данным. Для таких заказчиков важны контурность, происхождение технологий, соответствие регуляторным ожиданиям и возможность поддерживать решение без критической зависимости от внешних сервисов.
Поэтому растёт спрос на решения, которые можно развернуть у заказчика, адаптировать под его процессы и поддерживать внутри согласованного ИТ-контура.
Мы ожидаем продолжение роста рынка интеллектуальной обработки документов в 2026–2027 годах. При этом будет расти не только количество проектов, но и их зрелость.
Если раньше IDP часто внедрялся как отдельный инструмент распознавания, то в ближайшие годы будет увеличиваться доля проектов, встроенных непосредственно в бизнес-процессы. Заказчикам всё важнее прозрачность конвейера обработки, измеримые KPI и понятная зона ответственности на каждом этапе — от извлечения данных до их использования в учётных и управленческих системах.
В крупном бизнесе рынок продолжит развиваться, но скорость внедрения будет зависеть от требований безопасности, регуляторных ограничений и сложности внутренних процедур согласования.
Более высокая динамика ожидается в среднем бизнесе и части SMB. В 2026 году будет расти число точечных внедрений узкоспециализированных модулей, ориентированных на конкретный экономический эффект: автоматизацию рутинных операций и сокращение операционных затрат.
Наиболее активным сегментом становятся компании, которые уже ощущают масштаб проблемы документооборота, но при этом сохраняют достаточную гибкость для быстрого внедрения новых технологий.
Главный вывод простой: внедрение IDP стоит начинать не с выбора OCR-движка и не с вопроса «какую модель подключить».
Лучше начинать с карты процесса:
IDP в 2026 году — это уже не просто распознавание документов. Это технологический слой, который помогает компаниям превращать документы в проверенные данные и встраивать их в реальные бизнес-процессы.
Если в вашей компании много ручной работы с документами — инвойсами, актами, спецификациями, договорами, заявками, транспортными или таможенными документами — мы можем помочь оценить, какие части процесса можно автоматизировать и с чего лучше начать.