怎么在Python中利用OCR对PDF图片进行识别 - 行业资讯 - 肥雀云

　　介绍

本篇文章给大家分享的是有关怎么在Python中利用OCR对PDF图片进行识别,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

使用场景

使用图片识别可以快速提取图片中的信息,方便高效。

Python并不能直接对PDF进行识别,所以如果是识别PDF的话,需要先将PDF转化为图片,然后再进行识别。

必备工具

<李>

Python

可以安装3.7及以上版本

<李>

tesseract-ocr

下载地址:,https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可

<李>

需要用到的库

pip install 枕头　　pip install opencv-python 　　pip install 菲茨　　pip install PyMuPDF 　　pip install pytesseract

代码示例

得到PIL import 形象　　import 操作系统　　import pytesseract 　　import cv2 as 简历　　import 弗茨　　　　def pdf_image (pdfPath imgPath、zoom_x zoom_y, rotation_angle): 　　#,才能打开PDF文件　　时间=pdf 才能;fitz.open (pdfPath) 　　#才能,逐页读取PDF 　　for 才能;pg 拷贝范围(0,,pdf.pageCount): 　　,,,page =, pdf (pg) 　　,,,#,设置缩放和旋转系数　　,,,trans =, fitz.Matrix (zoom_x, zoom_y) .preRotate (rotation_angle) 　　,,,pm =, page.getPixmap(矩阵=反式,α=False) 　　,,,#,开始写图像　　,,,pm.writePNG (imgPath + str (pg) +“.png") 　　,,,# pm.writePNG (imgPath) 　　pdf.close才能() 　　pdf_path =& # 39; D:/123. pdf # 39; 　　img_path =& # 39; D:/123. png # 39; 　　pdf_image (pdf_path img_path 5 5 0) 　　#,依赖opencv 　　img=cv.imread (img_path) 　　文本=pytesseract.image_to_string (Image.fromarray (img) lang=& # 39; chi_tra& # 39;) 　　#,不依赖opencv写法　　#,文本=pytesseract.image_to_string (Image.open (img_path)) 　　打印(文本)

以上就是怎么在Python中利用OCR对PDF图片进行识别,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。