在Python爬虫过程中,难免遇到各种各样的验证码问题,最简单的就是
如果报错了还得有一步操作。
将Tesseract-OCR下的tessdata文件复制到你的Python安装路径下的脚本:
从公益诉讼导入图像 进口tesserocr 图像放大=Image.open (“test.jpg”) 打印(tesserocr.image_to_text(图像放大) imag1=Image.open (“image.png”) 打印(tesserocr.image_to_text (imag1)
输出结果如下: