影像档案

专注新技术,专注管理,专业团队,专业服务



OCR文字识别

2019-08-30

一、产品简介

      表格票据自动识别开发包(SDK)是一款通用的数据批量采集组件产品,适用于具有表格特征的表单、问卷、单证、发票,通过扫描、图像处理、自动分类、OCR(光学字符识别)技术,将表格图像中的数据信息准确、快速、真实地提取并保存,数据结果可转化为标准的数据格式,如XML、Excel等,与企事业单位的ERP、CRM等系统实现无缝结合。产品支持中英文、数字、符号等多类型字符的手写体、印刷体识别。

二、应用背景

传统的人工数据录入方式,这是目前使用最多的方式,由专门的数据录入员将数据一条一条录入计算机存储,数据流向企业ERP系统、Excel记录型表格。这种方式耗费了大量的人力和时间,计算机在此方案中只是数据载体,并未高效应用,弊端显而易见:

1.  录单任务繁重、强度大、录入员在高强度重复工作状态下极易疲劳出错;

2.  增加录单人手、增加计算机设备都导致办公成本增加;

3.  基础数据采集效率低下导致综合统计数据滞后,导致公司的其他业务信息管理系统(如ERP、CRM)所发挥的性能大打折扣,从而影响企业正确决策。

使用OCR技术实现自动录单,通过批量扫描识别的方式采集表单、票据数据,大大提高数据采集的效率,把繁重重复的工作交给计算机去处理,充分发挥了计算机处理技术的优势,录单主体的变更带来的是录单效率本质的提高。举例测算,一张A4订单中有15条数据,熟练录入员录单需要120秒,而OCR技术仅需要1.5秒,速率提高是120S/1.5S = 79倍,优势明显。

三、系统流程概述

3.1工作流程概述

工作流程.jpg

系统流程图

3.2系统识别性能参数:

    识别字符类型

²  印刷体:中文(简繁体)、英文、数字

²  手写体:中文(简繁体)、英文、数字

²  符号类:标识码、条码、 CheckBox╳、▇、○、●等,可定制符号

²  8种可定制字符:日、韩、蒙古、藏、维吾尔、哈萨克、柯尔克孜、阿拉伯文

    识别速度

²  单张表格的识别速度在  1 秒钟左右;

    识别率

²  对于版面整洁的印刷字符的识别,正确率达99.96%

²  对于规范手写数字、英文的识别,正确率达98.5%

²  对于规范手写汉字的识别,正确率在 85%左右;

 

3.3 SDK主要模块及功能特点:

模板编辑器:轻松快速定义识别模板;

图像预处理模块:自动去黑边、自动纠偏、去噪声、图像自动旋转、多种二值化方法处理;

影像自动分类:系统能自动区分当前表格、票据的业务类别,实现全自动归档;

字符识别引擎:支持识别丰富的文字、符号类型;

快速校对工具:纵向(集字)校对器、横向校对器

 

3.4 SDK开发环境

计算机性能:CPU-2.0GHz,内存-512MB,硬盘-2G;

操作系统:Windows系列

API接口:以标准的DLL(动态链接库)、OCX控件方式提供,支持VB、C#、Delphi、PB、C/C++/VC++、Java等常用程序语言的调用;

四、我们的技术服务

我们的宗旨是为客户提供企业级的数据采集技术,我们的技术服务内容包括识别需求评估、表格规范设计、模板定制、二次开发技术支持,在企事业客户开发应用系统的过程中,我们将全程跟踪,为客户方提供专业团队的技术服务。

五、应用领域

应用领域.png

w  制造业:订货会订单处理、生产计划等表单处理

w  政府部门:各种申请表、申报表的数据录入

w  银行、证券部门:存单、储单、证券交易单据、信用卡申请表的数据录入

w  工商、税务部门:各种纳税申报表、组织结构代码申报表的数据录入

w  统计部门:社会调查表、人口普查表、农业普查表、商业调查表的数据录入

w  人事部门:人事测评、干部考核表的数据录入

w  保险行业:保险单的数据录入

w  企、事业单位:进出库票据、订货单、单位内部报表的数据录入

 

六、行业应用方案

1.工商年检表格识别系统

在企业年检工作中,企业需要递交年检报告书,将企业的经营状况填写上去,工商局通过对企业年检书的审核,来确定企业是否通过年检,是否可以继续经营。各地工商局每年都要将大量的企业年检数据录入到数据库中,手工录入,速度慢、准确率低。为了提高工作效率和准确率,肆专应用表格自动录入系统,与工商部门进行沟通和合作,推出肆专工商年检表格识别系统,通过与系统集成商合作,为工商部门提供工商年检解决方案。
    通过以下工作过程,应用肆专表格识别系统,将工商年检表格识别成文本文件,将表格文本转入数据库保存应用。

1.因为原有表格属于手写数字填写的表格,所以将原有的年检表格重新设计,保留一定的字间距,便于识别,重新设计表格如下图所示:

设计表.png

2、表格设计完成后,用肆专表格识别系统中的表格模板编辑器,生成相对应的模板文件。
    3、将新生成的模板文件导入肆专工商年检表格识别系统中,这样就可以使用肆专工商年检表格识别系统。
    4、企业年检时,将年检报告书连同北京市企业年检数据扫描表一起递交工商部门。
    5、北京市企业年检数据扫描表通过扫描仪扫描识别后,形成文本文件,我们提供接口,将数据录入到北京市企业年检系统中(北京工商管理局主持开发)。

2. 华为电子影像数据系统

截至2016年底,华为已有17万余名员工,华为的产品和解决方案已经应用于全球170多个国家,服务全球运营商50强中的45家及全球1/3的人口。遍及全球的业务每年都有几百万份销售订单,使得每年需要处理上百万份单据。现在的单据处理方式还停留在通过人工方式将单据内容手动录入到系统中,人工录入的方式除了效率低以外,还存在员工疏忽或者疲劳导致的误操作。如何快速、准确的处理如此数量庞大的单据成为了一大诉求。

OCR表格票据文字识别解决了华为的大难题,它可以通过OCR识别技术,对内部的单据进行定制化,然后输出结构化的信息。完全避免了手工录入所造成的失误。

1568796236122696.jpg

表单文字识别OCR技术可以自动采集关键数据,建立数据资产,并进行大数据分析,可以有效降低华为的运营成本,提升业务效率。通过智能化服务,可帮助华为在全球范围内节省大量人力;分析海关估价等关键信息,控制每年千万美金级的风险敞口,业务流程自动化比例大幅提升。

除表单文字识别外,肆专科技还提供其他OCR服务和基于OCR的解决方案,支持更多应用场景,满足更多客户的需求。例如,通过拍照扫描等方式,提供身份信息的快速自动录入体验,以提高边检/酒店/旅游/公共安全以及电商等行业领域的工作效率;自然场景OCR可以捕获现实中多种场景下的文字,可有效支持虚拟现实、人机交互、图像检索、无人驾驶、车牌识别、工业自动化等领域中广泛的应用。

 


上一篇: 车牌识别
下一篇: 证件识别


QQ咨询

在线咨询 真诚为您提供专业解答服务

咨询热线

0755-22952623
7*24小时服务热线

关注微信

二维码 扫一扫添加微信