Счета и другие бумажные материалы можно найти повсюду в нашей повседневной жизни. Некоторые из бумажных материалов очень важны для нас. Если не соблюдать осторожность, легко потеряться и повредиться, причиняя нам неразрешимые проблемы. В информационную эпоху методы управления бумажными материалами, такими как счета и формы, постоянно обновляются. В настоящее время электронное управление становится мейнстримом.

В прошлом информатизация счетов, бланков и других бумажных материалов полностью зависела от ручного ввода, что было не только неэффективно, подвержено ошибкам, но и требовало огромных людских и материальных ресурсов. Кроме того, ручной ввод данных не может применяться к алгоритмам ИИ.

Возьмем в качестве примера страховую отрасль. К концу 2018 года общий годовой доход страхового рынка Китая достиг 3,8 трлн. Он поддерживает высокие темпы роста в течение последних десяти лет, и текущие темпы роста также поддерживаются на уровне около 10%. Рост страховой отрасли привел к появлению большого количества страховых документов. В 2017 году в Китае было около 5,1 миллиарда страховых документов. Рассчитанный на основе среднегодового темпа роста в 10%, ожидается, что в 2021 году страховые документы составят 7,5 миллиардов. В ближайшем будущем они превысят десятки миллиардов в год.

С системой распознавания счетов OCR нам нужно только сделать фото и отсканировать, система автоматически соберет данные о страховых документах. Datatang предоставляет эффективное решение для обработки страховых документов — платформу Shujiajia Pro для маркировки данных. Он используется для завершения создания основных возможностей системы распознавания банкнот OCR. Система распознавания банкнот OCR в основном включает четыре модуля: предварительная идентификация OCR, ручное управление, вывод данных, итерация модели. Они образуют замкнутый цикл человек в петле.

Shujiajia Pro — это платформа обработки данных, разработанная Datatang на основе многолетнего опыта. Он охватывает шаблонные инструменты, отточенные годами реального производственного опыта, процесс управления качеством маркировки данных, возможности обработки данных и предварительной идентификации в режиме онлайн.

Shujiajia Pro: эксперт по маркировке данных

Основанный на механизме распознавания OCR, Shujiajia Pro поддерживает службу предварительной идентификации OCR (обнаружение на уровне строки + расшифровка текста). Точность предварительной идентификации достигает 90% (четкий шрифт и отсутствие наклона под большим углом).

Поскольку набор данных постоянно обновляется, а алгоритм также повторяется, производительность алгоритма будет продолжать улучшаться. Shujiajia Pro можно гибко переключать на собственный механизм предварительной идентификации клиента. Система и механизм предварительной идентификации клиента слабо связаны через плагин. Клиентам нужно только разработать образ Docker в соответствии со спецификацией плагина и загрузить его в систему.

Случай 1. Счет-фактура с налогом на добавленную стоимость

После обработки предварительной идентификации результаты будут отображаться для аннотатора в шаблоне OCR. Аннотатор исправит ошибку, вызванную системой предварительной идентификации, а затем отправит ее на проверку качества.

С помощью механизма предварительного распознавания OCR эффективность маркировки может быть повышена примерно на 30%.

Случай 2. Квитанция об оплате амбулаторного лечения

Технология предварительной идентификации Datatang OCR может обрабатывать несколько форм счетов, таких как счета, квитанции об оплате амбулаторных услуг, счета за такси, страховые документы, больничные записи, счета за автострахование и т. д.

Через предварительную идентификацию и ручное исправление ошибок данные будут переданы инспектору по качеству. Инспектор качества укажет на полную ошибку изображения и ошибку данных на уровне метки, объяснит причину ошибки и вернет данные аннотатору для исправления. В систему встроено множество типов ошибок, таких как: ошибка кадра, несоответствие объекта метки, неправильная метка и атрибут и т. д. Система также поддерживает менеджера проекта для настройки типа ошибки в соответствии с проектом.

Данные результата выводятся в формате «json». Для различных потребностей клиентов мы можем предоставить различные онлайн-программы преобразования форматов: например, Pascal VOC (.xml), Labelme (.json) и другие выходные данные, которые можно импортировать в платформу данных или сформировать стандартный набор данных AI. для итерации алгоритма.

Конец

Datatang предоставляет комплексное и эффективное решение для управления счетами посредством приватизации платформы Shujiajia Pro и обеспечивает конфиденциальность и безопасность данных клиентов посредством приватизации.

Если вам нужны услуги передачи данных, свяжитесь с нами: [email protected]