介绍使用场景
必备工具
本篇文章给大家分享的是有关怎么在Python中利用OCR对PDF图片进行识别,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。
使用场景
使用图片识别可以快速提取图片中的信息,方便高效。
Python并不能直接对PDF进行识别,所以如果是识别PDF的话,需要先将PDF转化为图片,然后再进行识别。
必备工具
- <李>
Python
可以安装3.7及以上版本
- <李>
tesseract-ocr
下载地址:,https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可
- <李>
需要用到的库
李>pip install 枕头 pip install  opencv-python pip install 菲茨 pip install  PyMuPDF pip install  pytesseract
代码示例
得到PIL import 形象 import 操作系统 import pytesseract import cv2  as 简历 import 弗茨 def pdf_image (pdfPath imgPath、zoom_x zoom_y, rotation_angle): #,才能打开PDF文件 时间=pdf 才能;fitz.open (pdfPath) #才能,逐页读取PDF for 才能;pg 拷贝范围(0,,pdf.pageCount): ,,,page =, pdf (pg) ,,,#,设置缩放和旋转系数 ,,,trans =, fitz.Matrix (zoom_x, zoom_y) .preRotate (rotation_angle) ,,,pm =, page.getPixmap(矩阵=反式,α=False) ,,,#,开始写图像 ,,,pm.writePNG (imgPath + str (pg) +“.png") ,,,# pm.writePNG (imgPath) pdf.close才能() pdf_path =& # 39; D:/123. pdf # 39; img_path =& # 39; D:/123. png # 39; pdf_image (pdf_path img_path 5 5 0) #,依赖opencv img=cv.imread (img_path) 文本=pytesseract.image_to_string (Image.fromarray (img) lang=& # 39; chi_tra& # 39;) #,不依赖opencv写法 #,文本=pytesseract.image_to_string (Image.open (img_path)) 打印(文本)
以上就是怎么在Python中利用OCR对PDF图片进行识别,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。