隐藏

tesseract 中英文混合识别

发布:2018/12/24 1:33:17作者:管理员 来源:本站 浏览次数:1705

原图如下,


要识别上图中的字符,用命令

tesseract 05.png 05 -l chi_sim

只能很好的识别中文,英文就没那么准了,结果如下,


换个字库文件看看,运行命令如下,

tesseract 05.png 05_en -l eng

运行结果,


这下英文识别准确了,中文又掉链子了。有没有什么方法能同时支持这两个字库呢?

字库之间用加好"+"连接就可以了,命令如下,

tesseract 05.png 05 -l chi_sim+eng

运行结果,