
强大高效文字识别软件文通TH-OCR 11.0 SDK
6 联系人:
刘女士:13910860481
周先生:13911896172
文字识别一般包括文字信息的采集、信息的分析与处理、信息的分类判别等几个部分。
信息采集 将纸面上的文字灰度变换成电信号,输入到计算机中去。信息采集由文字识别机中的送纸机构和光电变换装置来实现,有飞点扫描、摄像机、光敏元件和激光扫描等光电变换装置。
信息分析和处理 对变换后的电信号消除各种由于印刷质量、纸质(均匀性、污点等)或书写工具等因素所造成的噪音和干扰,进行大小、偏转、浓淡、粗细等各种正规化处理。
信息的分类判别 对去掉噪声并正规化后的文字信息进行分类判别,以输出识别结果。
北京文通科技有限公司,是中文识别的全球领导厂商,具有深厚的技术储备。
文通TH-OCR 11.0 SDK ,是北京文通科技有限公司研制开发的多语种亚洲语言文字识别软件开发包,提供强大的识别API开发接口,帮助用户将OCR文字识别技术无缝内嵌到用户业务系统中,为数字资源的建立提供了方便,快捷,稳定的技术手段。
TH-OCR SDK 支持简体中文识别、繁体中文识别、日文识别、韩文识别、纯英文识别,具有识别率高、适应性强等突出的技术优势。
针对国内的少数民族语言识别市场,文通公司还推出了:藏文识别、蒙文识别,维文识别、阿拉伯文识别、哈萨克文识别、柯尔克孜文识别、朝文识别的少数民族语言识别核心,如有少数民族语言识别需求,也可以进行产品的定制。
针对信息安全、舆情监控市场,在敏感地区,例如新疆和西藏,藏文识别和维文识别在这方面也起到了举足轻重的作用,可以在网络上发布的不和谐图片当中,把文字识别出来。
TH-OCR 11.0 SDK不仅支持常用的图片格式,例如:TIF,JPG,BMP等,还支持PDF OCR功能,可以把图片PDF转化成文本文件或双层PDF。
1、可以将书摊平,一次将两边都扫描或拍摄下来,节省时间。处理图片时不必剪开,这时要用到 分栏工具了。直接用鼠标在打开的图象上拖拽,可出现选框,分成左右两个分栏,分栏左上角的编号就是识别结果的排列顺序。它会将自动按照编号顺序将所有分栏的内容连接在一起。
2、手动分栏可解决部分图象无法识别的问题。在进行识别后,可以看到版面分析结果,有时候由于图象质量原因,自动分析出的有效版面只是很小的一部分。此时可以按ctrl+del取消版面分析结果,用鼠标拖拽,划定需要识别的范围,重新进行识别。当图片质量问题不大时,这个办法有效。
*您的姓名:
*联系手机:
固话电话:
E-mail:
所在单位:
需求数量:
*咨询内容: