您的位置:极速下载站 → 电脑软件 → 其他软件 → 其他综合 → jTessBoxEditor
jTessBoxEditor是一款基于Java开发的Tesseract-OCR图片文字识别准确率提升工具。它需要适合Tesseract OCR软件使用,作用是提升OCR文字识别的准确性,需要的网友可以下载jTessBoxEditor绿色版使用。
Tesseract OCR下载地址:http://www.jisuxz.com/down/67987.html
使用方法
jTessBoxEditor的运行环境为JAVA虚拟机,teesseract智能图片识别软件的训练框架,不需要安装直接解压即可,不过要事先安装一个jar包jdk-8u101-windows-x64虚拟机。
用jTessBoxEditor自动训练3500常用汉字
打开jTessBoxEditor图形化界面
(1)点击TIFF/BoxGenerator按钮
(2)将3500汉字copy到空白区域
(3)选择文件夹:(自己创建文件夹名字随意,我的是在F盘创建的)
(4)命名(自己随意命名,比如我的是haha)
(5) 选择自己药训练的字体(比如我的是宋体9pt)
(6)然后点击Generate按钮生成tif和box文件
(7)点击Trainer按钮
(8)打开之前创建的文件夹
(9)Language那里需要改名字(改成与第四步一样的名字,我的是haha)
(10)选择Train with Existing Box
(11)然后点击run
(12)成功后:
更新日志
版本0.1(2011年4月10日):
- 支持Tesseract 2.0x和3.0x格式的编辑框数据
- 实现框选择和合并/拆分/插入/删除操作
- 通过微调器实现盒子尺寸更改功能
- 支持文本字段的Unicode转换
- 包括框搜索功能
相关搜索:OCR