Наш клиент работает с системой, которая объединяет клиентов с большими объемами накопленных строительных чертежей, некоторые из которых представляют собой очень старые, отсканированные бумажные документы.
Прежде чем загрузить эти чертежи в систему, их необходимо проиндексировать, извлекая из титульного блока ключевую информацию, такую как номер чертежа, масштаб, ревизия и другие параметры. Эта задача является однотипной и трудоемкой, и её выполняли вручную.
Но такой подход достаточно медленный и дорогостоящий. Поэтому клиент искал более быстрое и эффективное решение с использованием машинного обучения и искусственного интеллекта.
Разработанная система представляет собой решение на базе искусственного интеллекта, которое автоматизирует извлечение данных из ключевых полей строительных чертежей и корректирует их ориентацию для беспрепятственной интеграции в систему клиента.
Оно сочетает в себе Azure Document Intelligence для извлечения данных и двухэтапный процесс коррекции ориентации изображений с помощью Tesseract и PaddleOCR.
Основой системы является Azure Document Intelligence. Мы обучили пользовательскую модель на образцах чертежей, предоставленных клиентом, и научили ее распознавать и извлекать шесть ключевых полей: название, тип, номер чертежа, номер листа, масштаб и пересмотр.
В отличие от типовых инструментов OCR, способность Azure обучаться на основе помеченных данных обеспечивает высокую точность, даже при изменчивости старых отсканированных чертежей. Это устраняет необходимость ручного вмешательства и значительно ускоряет процесс индексирования.
Чтобы обеспечить правильное выравнивание всех чертежей перед извлечением данных, система использует двухэтапный процесс коррекции ориентации:
Система была разработана с целью досижения экономической эффективности. Автоматизируя процессы извлечения данных и корректировки ориентации, она устраняет необходимость в дорогостоящем ручном труде. Бюджетные расчеты показывают, что автоматизированное решение уже сейчас является более экономичным, чем привлечение сторонних организаций, а также обеспечивает более быстрые и стабильные результаты.
Результаты превзошли ожидания. Обучив модель искусственного интеллекта Azure, мы добились высокой точности извлечения данных для шести целевых полей. Автоматизированное решение не только превзошло ручной труд по скорости и стоимости, но и дало дополнительное преимущество: автоматическую коррекцию ориентации - задачу, которая ранее игнорировалась в ручных процессах.
Мы подсчитали бюджет на эту автоматизацию и пришли к выводу, что она более рентабельна, чем аутсорсинг ручного труда. Кроме того, включение функции коррекции ориентации дает значительные преимущества, поскольку обеспечивает единообразное выравнивание всех документов в системе.