有用过tesseract OCR字符识别的吗?怎么识别率那么低
答案:2 悬赏:60 手机版
解决时间 2021-03-09 09:22
- 提问者网友:树红树绿
- 2021-03-08 18:12
有用过tesseract OCR字符识别的吗?怎么识别率那么低
最佳答案
- 五星知识达人网友:未来江山和你
- 2021-03-08 19:16
识别率低是因为tesseract 想做到适应各种字体、各种分辨率。要在工程中用的话,可以先用tesseract 识别,再根据错误类型二次识别。根据我的经验,tesseract 的错误还是比较有规律的
全部回答
- 1楼网友:由着我着迷
- 2021-03-08 20:07
识别率低是因为tesseract 想做到适应各种字体、各种分辨率,结果就造成了识别率低的尴尬局面。
要想识别率高的话,可以采用abbyy finereader是ocr(光学辨识)软件。比较常用的功能为:扫描到 word、将pdf图像、图片转换为 word 文档或者可编辑可搜索的pdf文档,另外也支持将pdf图像转换为 excel 文档。
ocr 识别是肯定会存在错误的,所以识别转换完成以后记得要和原文核对。 设置语言种类的话,越少识别率越高,就是说如果文件只有中文的话,那么就设置中文一种语言,不要选择其他语言,这样识别速度也会提高。
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯