详解Python安装tesserocr遇到的各种问题及解决办法

  

  

在Python爬虫过程中,难免遇到各种各样的验证码问题,最简单的就是详解Python安装tesserocr遇到的各种问题及解决办法”> & # 8203;这种验证码了,那么在遇到验证码的时候该怎么办呢?我们就需要OCR技术了,OCR -即光学字符识别光学字符识别,是指通过扫描字符,然后将其形状翻译成电子文本的过程。而tesserocr是Python的一个OCR识别库,所以在安装tesserocr之前,我们需要安装超正方体这个东西</p>
  <p>下载地址:https://digi.bib.uni-mannheim.de/tesseract/可以选择下载不带dev的稳定版本,我下载的是3.05.01版本的,不过这个版本的可能比较早了,识别能力不是很厉害,读者可以选择下载最新版本的3.05.02,识别能力应该会好很多。</p>
  <p>下载完就是一路双击,在最后的额外的语言数据(下载)选上这个选项,是OCR支持各种语言的包,然后继续安装,直到安装成功。</p>
  <p>我的安装路径为:G: \程序文件(x86) \ Tesseract-OCR </p>
  <p> <img src=

  

如果报错了还得有一步操作。

  

将Tesseract-OCR下的tessdata文件复制到你的Python安装路径下的脚本:

  

详解Python安装tesserocr遇到的各种问题及解决办法”> <br/>
  </p>
  </p> <p>这样
  <p> <img src=   从公益诉讼导入图像   进口tesserocr      图像放大=Image.open (“test.jpg”)   打印(tesserocr.image_to_text(图像放大)   imag1=Image.open (“image.png”)   打印(tesserocr.image_to_text (imag1)      

输出结果如下:

  

详解Python安装tesserocr遇到的各种问题及解决办法

详解Python安装tesserocr遇到的各种问题及解决办法