永发信息网

如何用python 自己写一个ocr

答案:2  悬赏:60  手机版
解决时间 2021-02-07 13:42
  • 提问者网友:鐵馬踏冰河
  • 2021-02-06 19:39
如何用python 自己写一个ocr
最佳答案
  • 五星知识达人网友:过活
  • 2021-02-06 20:47
推荐使用现有的ocr库,没必要自己造轮子。现有的有三个库都可以用来识别,也都是基于Tesseract的一个封装。
pyocr:Tesseract 和 Cuneiform 的一个封装(wrapper)。
pytesseract:Google Tesseract OCR 的另一个封装(wrapper)。
python-tesseract - Google Tesseract OCR 的一个包装类。
全部回答
  • 1楼网友:迟山
  • 2021-02-06 22:21
您好,自己实现ocr的话您需要学习模式识别/机器学习相关知识以及计算机视觉的部分知识。首先需要定位文本区域,阈值化,切割为单字符,最难的部分是字符的识别,如果识别的文本是规范的,可以考虑用匹配滤波器(不推荐,但简单),或向量空间搜索,正规的方式还是推荐使用机器学习中神经网络的卷积神经网络(cnn)来训练和识别。为训练cnn您可能还需要一些数据挖掘与图像处理方面的知识,以方便您获取数据集(即字符图片集)来训练cnn,这通常需要大量的数据与较长的训练时间(时间与字符图片大小、字符图片集数量、神经网络结构与规模等相关)
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯