如何用Python实现图像文字识别OCR工具

  介绍

这篇文章主要介绍”如何用Python实现图像文字识别OCR工具”,在日常操作中,相信很多人在如何用Python实现图像文字识别OCR工具问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答“如何用Python实现图像文字识别OCR工具”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

引言

最近在技术交流群里聊到一个关于图像文字识别的需求,在工作,生活中常常会用的到,比如票据,漫画,扫描件,照片的文本提取。

博主基于PyQt + PaddleOCR写了一个桌面端的OCR工具,用于快速实现图片中文本区域自动检测+文本自动识别。

识别效果如下图所示:

如何用Python实现图像文字识别OCR工具

所有框选区域为OCR算法自动检测,右侧列表有每个框对应的文字内容;

点击右侧“识别结果”中的文本记录,然后点击“复制到剪贴板”即可复制该文本内容。

功能列表

<李>

文本区域检测+文字识别

<李>

文本区域可视化

<李>

文字内容列表

<李>

图像,文件夹加载

<李>

图像滚轮缩放查看

<李>

绘制区域,编辑区域

<李>

复制文本识别结果

OCR部分

图像文字检测+文字识别算法,主要借助PaddleOCR实现。

创建或者选择一个虚拟环境,安装需要用到的第三方库。

conda  create  -n 光学字符识别   conda  activate  ocr

①安装框架

如果你没有NVIDIA GPU,或GPU不支持CUDA,可以安装CPU版本:

#, CPU版本   pip  install  paddlepaddle==2.1.0 小姐;https://mirror.baidu.com/pypi/simple

如果你的GPU安装过CUDA9或CUDA10, cuDNN 7.6 +,可以选择下面这个GPU版本:

#, GPU版本   python3  -m  pip  install  paddlepaddle-gpu==2.1.0 小姐;https://mirror.baidu.com/pypi/simple

②安装PaddleOCR

安装PaddleOCR:

pip  install “paddleocr>=2.0.1", #,推荐使用2.0.1 +版本

版面分析,需要安装Layout-Parser:

pip3  install  -U  https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl

③测试安装是否成功

安装完成后,测试一张图片——image_dir。/一/11. jpg,采用中英文检测+方向分类器+识别全流程:

paddleocr ——image_dir 。/一/11. jpg ——use_angle_cls  true ——use_gpu 假

输出一个列表:

如何用Python实现图像文字识别OCR工具

④在Python中调用

得到paddleocr  import  PaddleOCR, draw_ocr      #,Paddleocr目前支持的多语言语种可以通过修改朗参数进行切换   #,例如“ch”,“恩”,,“fr”,“德国”,“韩国”,“日本”   时间=ocr  PaddleOCR (use_angle_cls=True, lang=癱h"),, #, need 用run  only  once 用download 以及load  model  into 内存   img_path =& # 39;。/一/11. jpg # 39;   时间=result  ocr.ocr (img_path, cls=True)   for  line 结果:拷贝   ,,,print(线)

输出结果是一个列表,每个项目包含了文本框,文字和识别置信度:

[[[24.0, 36.0],[304.0, 34.0],[304.0, 72.0],[24.0, 74.0]],['纯臻营养护发素& # 39;,0.964739]]

[[[24.0, 80.0],[172.0, 80.0],[172.0, 104.0],[24.0, 104.0]],['产品信息/参数& # 39;,0.98069626]]

[[[24.0, 109.0],[333.0, 109.0],[333.0, 136.0],[24.0, 136.0]],[& # 39;(45元/每公斤,100年公斤起订)& # 39;,0.9676722]]

界面部分

界面部分基于pyqt5实现。

pyqt GUI程序开发入门和环境配置,详见这篇博客。

主要步骤:

1。界面布局设计

在QtDesigner中拖拽控件,完成程序界面布的局,并保存*。ui文件。

如何用Python实现图像文字识别OCR工具

2。利用pyuic自动生成界面代码

在pycharm的项目文件结构中找到*。ui文件,右键——外部工具——pyuic,会在ui文件同级目录下自动生成界面ui的python代码。

如何用python实现图像文字识别OCR工具

如何用Python实现图像文字识别OCR工具