这篇文章主要介绍”如何用Python实现图像文字识别OCR工具”,在日常操作中,相信很多人在如何用Python实现图像文字识别OCR工具问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答“如何用Python实现图像文字识别OCR工具”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
引言
最近在技术交流群里聊到一个关于图像文字识别的需求,在工作,生活中常常会用的到,比如票据,漫画,扫描件,照片的文本提取。
博主基于PyQt + PaddleOCR写了一个桌面端的OCR工具,用于快速实现图片中文本区域自动检测+文本自动识别。
识别效果如下图所示:
所有框选区域为OCR算法自动检测,右侧列表有每个框对应的文字内容;
点击右侧“识别结果”中的文本记录,然后点击“复制到剪贴板”即可复制该文本内容。
功能列表
- <李>
文本区域检测+文字识别
李> <李>文本区域可视化
李> <李>文字内容列表
李> <李>图像,文件夹加载
李> <李>图像滚轮缩放查看
李> <李>绘制区域,编辑区域
李> <李>复制文本识别结果
李>OCR部分
图像文字检测+文字识别算法,主要借助PaddleOCR实现。
创建或者选择一个虚拟环境,安装需要用到的第三方库。
conda create -n 光学字符识别 conda activate  ocr
①安装框架
如果你没有NVIDIA GPU,或GPU不支持CUDA,可以安装CPU版本:
#, CPU版本 pip install  paddlepaddle==2.1.0 小姐;https://mirror.baidu.com/pypi/simple
如果你的GPU安装过CUDA9或CUDA10, cuDNN 7.6 +,可以选择下面这个GPU版本:
#, GPU版本 python3 -m  pip install  paddlepaddle-gpu==2.1.0 小姐;https://mirror.baidu.com/pypi/simple
②安装PaddleOCR
安装PaddleOCR:
pip install “paddleocr>=2.0.1", #,推荐使用2.0.1 +版本
版面分析,需要安装Layout-Parser:
pip3 install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl
③测试安装是否成功
安装完成后,测试一张图片——image_dir。/一/11. jpg,采用中英文检测+方向分类器+识别全流程:
paddleocr ——image_dir 。/一/11. jpg ——use_angle_cls true ——use_gpu 假
输出一个列表:
④在Python中调用
得到paddleocr import PaddleOCR, draw_ocr #,Paddleocr目前支持的多语言语种可以通过修改朗参数进行切换 #,例如“ch”,“恩”,,“fr”,“德国”,“韩国”,“日本” 时间=ocr PaddleOCR (use_angle_cls=True, lang=癱h"),, #, need 用run only once 用download 以及load model into 内存 img_path =& # 39;。/一/11. jpg # 39; 时间=result ocr.ocr (img_path, cls=True) for line 结果:拷贝 ,,,print(线)
输出结果是一个列表,每个项目包含了文本框,文字和识别置信度:
[[[24.0, 36.0],[304.0, 34.0],[304.0, 72.0],[24.0, 74.0]],['纯臻营养护发素& # 39;,0.964739]]
[[[24.0, 80.0],[172.0, 80.0],[172.0, 104.0],[24.0, 104.0]],['产品信息/参数& # 39;,0.98069626]]
[[[24.0, 109.0],[333.0, 109.0],[333.0, 136.0],[24.0, 136.0]],[& # 39;(45元/每公斤,100年公斤起订)& # 39;,0.9676722]]
…
引用>界面部分
界面部分基于pyqt5实现。
pyqt GUI程序开发入门和环境配置,详见这篇博客。
主要步骤:
1。界面布局设计
在QtDesigner中拖拽控件,完成程序界面布的局,并保存*。ui文件。
2。利用pyuic自动生成界面代码
在pycharm的项目文件结构中找到*。ui文件,右键——外部工具——pyuic,会在ui文件同级目录下自动生成界面ui的python代码。
如何用Python实现图像文字识别OCR工具