时间:2017-05-16 15:07:42 作者:不思议游戏 浏览量:36
在使用ABBYY FineReader 14识别文档时,要想获得快速准确的结果,选择正确的OCR选项很重要,决定好要使用的选项之后,还应该考虑文档的类型和复杂性,以及如何去使用识别结果。
OCR选项位于ABBYY FineReader‘选项’对话框的OCR选项卡上(点击工具 > 选项…打开此对话框)。
ABBYY FineReader 14可以自动识别添加到OCR项目的任何页面,当前选定的选项将用于OCR过程,你也可以在图像处理选项卡上关闭最新添加的图像的自动分析和OCR。
注意:如果在文档识别之后修改OCR选项,需再次运行OCR过程,通过新选项识别文档。
1、PDF识别模式
这些设置仅适用带有文本层和图片的PDF文档,这种PDF文档通常从可编辑格式的文档创建,其他类型的PDF文档,比如可搜索的PDF文档和仅图像PDF文档,通常在‘使用OCR’模式中处理,处理这种类型的PDF文档无需额外的设置。
有三种识别模式可以使用:
•自动在OCR和PDF中的文字之间选择
程序会检测文本层,如果它包含高质量的文本,便使用现有的高质量文本层,OCR将用于创建新的文本层。
•使用OCR
OCR将用于创建新的文本层,这种模式花费的时间更多,但更适用于文本层质量较差的文档。
•仅使用PDF中的文字
这是带有文本层PDF文档的默认模式,程序会使用原始文本层,无需运行OCR。
2、在OCR速度和准确度之间平衡
ABBYY FineReader 14可以让你:
•通篇识别
在这种模式下,FineReader 14既可以分析和识别简单的文档,也可以分析识别布局复杂的文档。这种识别需要更多时间,但最终的效果也更好。
•快速识别
这种模式建议用于处理布局简单且图像质量较好的较大文档。
3、检测结构元素
选择你希望程序检测的结构元素:页眉和页脚、脚注、目录以及编号列表,保存文档之后,选中的元素将可点击。
4、条码
如果你的文档包含条码,你希望将它们转化为字符串和数字,而不是保存为图片,则勾选‘转化条形码为字符串’,该功能通常是默认禁用的。