清华紫光OCR支持Windows环境下的GB、BIG5、JIS和Shift-JIS等多种内码。在印刷体汉字辨别中还加入了MMX优化技术,使辨别速度得到了非常大提升。大家用它辨别一页A4大小的印刷体中英文混排的纯文本文件,只用了几秒钟。而且辨别率特别高,只有极个别的字出现了差错。在这个版本中新增了表格辨别功能。选择了辨别表格的选项后,它会自动将表格的框线先辨别出来,再对表格中的文字进行辨别。文字全部辨别出来之后会将文字按原样恢复到表格中。在这项测试中辨别率也很好。但在测试中大家的工程师发现,当文字与表格的框线距离较近时,它的辨别成效就没那样理想了。假如用户想对一个图文混排的文件进行辨别,则清华紫光OCR还具备版面自动剖析功能。它自动对扫描的版面进行剖析,把应辨别的文字地区划分出来,之后进行辨别。对于被划分地区内的文字有非常高的辨别率,而且速度同样非常快。不过遗憾的是,在这个版本中没提供版面自动恢复的功能,因此假如想把文件恢复成原来的版面,则还需要重小白动排版。它的导出功能可以将带有表格的文当导出成为RTF格式的文件,从而允许用户在Word等应用程序中继续进行编辑。它还可以将扫描进去的图像格式转换成TIFF、BMP或PCZ等格式,具备非常大的灵活性。它的批量辨别功能可以让用户一次把多页文稿全部扫描之后再进行辨别,防止了扫描一页辨别一页带来的麻烦。这一版本最多可达成10000页的批量辨别。该版本还增加了一项很好用的功能,就是手写体的辨别。有了这一功能,很多以前手写的信件或文件就能扫描到计算机中,辨别出来后用电子文档的方法进行保存了。不过现在的手写体辨别功能还不够完全成熟,它对书写有非常高的需要,如每一个字之间要有肯定的间隔,不可以有连笔的状况等。尽管这样,手写体辨别这一功能还是可以在一定量上减轻文字录入工作的负担。该OCR还具备自学习功能,当遇见有生僻字时,可以通过键盘输入进行学习。有了这一功能,用户就能自由地添加一些本来不“认识”的字,大大拓宽了中文OCR系统的辨别字符集。清华紫光这一款专业版的OCR软件,不仅能够对纯文本文件进行辨别,而且可以进行复杂的图文混排和图表文档的辨别,最大限度地把大家从冗杂的文字再录入的工作中解脱出来。
转载请说明来源于当快软件园(https://www.lrvxg.com)
本文地址:https://www.lrvxg.com/soft/321.html
郑重声明:文章来源于网络作为参考,本站仅用于分享不存储任何下载资源,如果网站中图片和文字侵犯了您的版权,请联系我们处理!邮箱3450399331@qq.com