会博通:什么是OCR服务

2020/9/14 17:25:03       来源:        作者:孙超       浏览量:  1

众所周知,文档资料承载着一个企业的发展记忆、经验以及成果,一般管理只停留在个人或部门层面,这些重要的文档会因为员工离职而丢失,因为时间推移而失去记忆,也会因为使用不规范而出现遗失、损坏,更有被恶意扩散导致形成损失的可能。绍林科技通过30余年的努力已成为知识管理解决方案的开发、供应与运营专家,能为客户提供各式各样的知识类信息管理解决方案,绍林科技自主研发的知识管理系统品牌会博通能够提供图片、PDF文件的在线OCR服务,正确配置好OCR服务的相关参数后,当用户上传扫描图片文件后,系统将会分派一个后台任务,在系统空闲的时候,对文件进行文字识别成为文本文件,以方便系统进行全文检索和再利用。

 

会博通知识管理系统的用户也可以在文件属性页面,或邮件的附件列表页面,查看OCR的成果文件(按钮名称为文本)。

 

因为进行OCR识别需要访问百度智能云AI服务器,所以,系统管理员应确认是否具备互联网连接条件,并预先申请百度智能云账号,配置好系统参数。OCR的识别效果,与图片的质量密切相关。

 

注册百度智能云帐号

登录百度AI官网然后注册百度智能云AI帐号,点击控制台-文字识别-创建应用。然后填写应用程序名和应用类型,创建应用。进入应用列表后可以查看应用的API Key和Secret Key。

 


 

 

百度AI,一般普通识别,提供每天5万次的免费识别额度,对于一般用户已经足够,如果有特殊需求的用户也可以购买百度的OCR额度。具体可以参考百度的相关资料或咨询百度客服。

 

配置会博通OCR


说明:

 

会博通对于相关文件的处理:

1、 会将图片文件通过OCR转换为文本文件,以供搜索与利用。

2、 会将PDF文件里面的图片通过OCR转换为文本,并联同PDF文件中已有的格式文本,转换为文本文件。

3、 会将CAD文件中的文本抽取出来,保存为文本文件,以供搜索和再利用。

4、 OCR结果文本文件的浏览按钮位于属性和邮件中的文件列表的右侧,名称为文本。