Извлечение данных из старых строительных чертежей при помощи ИИ | Технологика
Апрель 2025

Извлечение данных из старых строительных чертежей при помощи ИИ

Извлечение данных из старых строительных чертежей при помощи ИИ
Направления
Система на базе искусственного интеллекта для обработки старых строительных чертежей с визуальными дефектами. Ротация отсканированных документов, извлечение ключевых полей данных.

Задача

Наш клиент работает с системой, которая объединяет клиентов с большими объемами накопленных строительных чертежей, некоторые из которых представляют собой очень старые, отсканированные бумажные документы.

Прежде чем загрузить эти чертежи в систему, их необходимо проиндексировать, извлекая из титульного блока ключевую информацию, такую как номер чертежа, масштаб, ревизия и другие параметры. Эта задача является однотипной и трудоемкой, и её выполняли вручную.

Но такой подход достаточно медленный и дорогостоящий. Поэтому клиент искал более быстрое и эффективное решение с использованием машинного обучения и искусственного интеллекта.

Решение

Разработанная система представляет собой решение на базе искусственного интеллекта, которое автоматизирует извлечение данных из ключевых полей строительных чертежей и корректирует их ориентацию для беспрепятственной интеграции в систему клиента.

Оно сочетает в себе Azure Document Intelligence для извлечения данных и двухэтапный процесс коррекции ориентации изображений с помощью Tesseract и PaddleOCR.

Извлечение данных с помощью Azure Document Intelligence

Основой системы является Azure Document Intelligence. Мы обучили пользовательскую модель на образцах чертежей, предоставленных клиентом, и научили ее распознавать и извлекать шесть ключевых полей: название, тип, номер чертежа, номер листа, масштаб и пересмотр.

В отличие от типовых инструментов OCR, способность Azure обучаться на основе помеченных данных обеспечивает высокую точность, даже при изменчивости старых отсканированных чертежей. Это устраняет необходимость ручного вмешательства и значительно ускоряет процесс индексирования.

Коррекция ориентации изображений

Чтобы обеспечить правильное выравнивание всех чертежей перед извлечением данных, система использует двухэтапный процесс коррекции ориентации:

  • Tesseract: определяет угол поворота всего изображения (0°, 90°, 180° или 270°) и соответствующим образом поворачивает его.
  • PaddleOCR: после первоначального поворота PaddleOCR обнаруживает все слова и их ограничительные рамки, вычисляет доминирующую ориентацию текста и точно настраивает выравнивание. Это особенно полезно для чертежей со смешанным вертикальным и горизонтальным текстом.
Экономически эффективная автоматизация

Система была разработана с целью досижения экономической эффективности. Автоматизируя процессы извлечения данных и корректировки ориентации, она устраняет необходимость в дорогостоящем ручном труде. Бюджетные расчеты показывают, что автоматизированное решение уже сейчас является более экономичным, чем привлечение сторонних организаций, а также обеспечивает более быстрые и стабильные результаты.

Результаты

Результаты превзошли ожидания. Обучив модель искусственного интеллекта Azure, мы добились высокой точности извлечения данных для шести целевых полей. Автоматизированное решение не только превзошло ручной труд по скорости и стоимости, но и дало дополнительное преимущество: автоматическую коррекцию ориентации - задачу, которая ранее игнорировалась в ручных процессах.

Мы подсчитали бюджет на эту автоматизацию и пришли к выводу, что она более рентабельна, чем аутсорсинг ручного труда. Кроме того, включение функции коррекции ориентации дает значительные преимущества, поскольку обеспечивает единообразное выравнивание всех документов в системе.

Давайте найдем решение для вашего бизнеса!

Давайте найдем решение для вашего бизнеса!

Пожалуйста, заполните 'Имя'
Пожалуйста, заполните 'Телефон'
Пожалуйста, заполните 'Емейл'
Пожалуйста, заполните 'Сообщение'

Пожалуйста, заполните 'Имя и фамилия'
Пожалуйста, заполните 'Телефон'
Пожалуйста, заполните 'Емейл'
Выберите файл
Пожалуйста, выберите файл 'Резюме'
Выберите файл
Пожалуйста, прикрепите файл 'Код / ТЗ'