怎么在Python中利用OCR对PDF图片进行识别

  介绍

本篇文章给大家分享的是有关怎么在Python中利用OCR对PDF图片进行识别,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

使用场景

使用图片识别可以快速提取图片中的信息,方便高效。

Python并不能直接对PDF进行识别,所以如果是识别PDF的话,需要先将PDF转化为图片,然后再进行识别。

必备工具

<李>

Python 

可以安装3.7及以上版本

<李>

tesseract-ocr 

下载地址:,https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可

<李>

需要用到的库

pip  install 枕头   pip  install  opencv-python   pip  install 菲茨   pip  install  PyMuPDF   pip  install  pytesseract

代码示例

得到PIL  import 形象   import 操作系统   import  pytesseract    import  cv2  as 简历   import 弗茨      def  pdf_image (pdfPath imgPath、zoom_x zoom_y, rotation_angle):   #,才能打开PDF文件   时间=pdf 才能;fitz.open (pdfPath)   #才能,逐页读取PDF   for 才能;pg 拷贝范围(0,,pdf.pageCount):   ,,,page =, pdf (pg)   ,,,#,设置缩放和旋转系数   ,,,trans =, fitz.Matrix (zoom_x, zoom_y) .preRotate (rotation_angle)   ,,,pm =, page.getPixmap(矩阵=反式,α=False)   ,,,#,开始写图像   ,,,pm.writePNG (imgPath + str (pg) +“.png")   ,,,# pm.writePNG (imgPath)   pdf.close才能()   pdf_path =& # 39; D:/123. pdf # 39;   img_path =& # 39; D:/123. png # 39;   pdf_image (pdf_path img_path 5 5 0)   #,依赖opencv   img=cv.imread (img_path)   文本=pytesseract.image_to_string (Image.fromarray (img) lang=& # 39; chi_tra& # 39;)   #,不依赖opencv写法   #,文本=pytesseract.image_to_string (Image.open (img_path))   打印(文本)

以上就是怎么在Python中利用OCR对PDF图片进行识别,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注行业资讯频道。

怎么在Python中利用OCR对PDF图片进行识别