
文通识别率高适应性强文字识别软件
识别率高适应性强文字识别软件
联系人:
刘女士:13910860481
周先生:13911896172
文字识别一般包括文字信息的采集、信息的分析与处理、信息的分类判别等几个部分。
信息采集 将纸面上的文字灰度变换成电信号,输入到计算机中去。信息采集由文字识别机中的送纸机构和光电变换装置来实现,有飞点扫描、摄像机、光敏元件和激光扫描等光电变换装置。
信息分析和处理 对变换后的电信号消除各种由于印刷质量、纸质(均匀性、污点等)或书写工具等因素所造成的噪音和干扰,进行大小、偏转、浓淡、粗细等各种正规化处理。
信息的分类判别 对去掉噪声并正规化后的文字信息进行分类判别,以输出识别结果。
北京文通科技有限公司,是中文识别的全球领导厂商,具有深厚的技术储备。
文通TH-OCR 11.0 SDK ,是北京文通科技有限公司研制开发的多语种亚洲语言文字识别软件开发包,提供强大的识别API开发接口,帮助用户将OCR文字识别技术无缝内嵌到用户业务系统中,为数字资源的建立提供了方 便,快捷,稳定的技术手段。
TH-OCR SDK 支持简体中文识别、繁体中文识别、日文识别、韩文识别、纯英文识别,具有识别率高、适应性强等突出的技术优势。
针对国内的少数民族语言识别市场,文通公司还推出了:藏文识别、蒙文识别,维文识别、阿拉伯文识别、哈萨克文识别、柯尔克孜文识别、朝文识别的少数民族语言识别核心,如有少数民族语言识别需求,也可以进行产品 的定制。
针对信息安全、舆情监控市场,在敏感地区,例如新疆和西藏,藏文识别和维文识别在这方面也起到了举足轻重的作用,可以在网络上发布的不和谐图片当中,把文字识别出来。
TH-OCR 11.0 SDK不仅支持常用的图片格式,例如:TIF,JPG,BMP等,还支持PDF OCR功能,可以把图片PDF转化成文本文件或双层PDF。
将输入的文字与给定的各类别标准文字(模板)进行相关匹配,计算输入文字与各模板之间的相似性程度,取相似度最大的类别作为识别结果。这种方法的缺点是当被识别类别数增加时,标准文字模板的数量也随之增加。这一方面会增加机器的存储容量,另一方面也会降低识别的正确率,所以这种方式适用于识别固定字型的印刷体文字。这种方法的优点是用整个文字进行相似度计算,所以对文字的缺损、边缘噪声等具有较强的适应能力。
*您的姓名:
*联系手机:
固话电话:
E-mail:
所在单位:
需求数量:
*咨询内容: