时间:2019-08-11 11:17:17 作者:johnnyl 浏览量:73
比如,单纯地给一个竖线,机器是无法区分到底是小写的 l、还是大写的 I(顺便问一下,你看出二者的区别了吗?);与之相对,机器是需要根据上下文进行判断和优化的。而像程序代码这种非自然语言,机器目前是很难进行语义识别的
到底准不准?你不妨一试。
独创算法,进一步优化识别结果
OCR 服务还有一些欠缺,iText 针对性地做了这些优化:
自动识别段落
中文环境使用全角标点符号
中文与英文字母、数字间增加空格
删除中文字符间、英文字符与标点符号间的多余空格
英文首字母大写
如果你发现识别不好的地方,欢迎把图发给我,我会相应地优化算法,毕竟算法是需要数据喂养的,先谢。
预览原图,方便校对
在目前 OCR 技术不能始终达到 100% 的情况下,预览原图、并进行修正,还是有必要的。在 iText 中,你可以这样:
将识别后的窗口拖到图片附近
调用 iText 识别结果的 双栏模式:左侧展示图片、右侧展示识别后的文字
MAC系统高效处理图片应用推荐十二!iText图四
这样,就可以很方便地对照原图进行手动优化识别后的文字。
如果你正在寻找一款小巧方便、效果出色的 OCR 工具,可以在 App Store 免费获取 iText。免费版限制每月识别 20 次,解除限制需花费 78 元/年订阅高级版。