记得应该是16年的时候,从一个公开课看到了关于OCR方面的内容,里面讲到了通过OpenCV对身份证号码区域的剪裁以及使用Tess-Two进行文字识别,实现了对身份证号码的识别功能。
断断续续看了点关于OpenCV的资料,感觉不是这个专业的真难看懂,各种公式各种名词。今天主要用于做个记录,那个一直碎碎念的东西终于完成了!
<强>原理强>
我理解的原理(除去文字识别):
-
<李>对图片进行降噪以及二值化,凸显内容区域李>
<李>对图片进行轮廓检测李>
<李>对轮廓结果进行分析李>
<李>剪裁指定区域李>
代码实现
本文采用VS2017实现,代码如下:
# include“stdafx.h” # include“idocr.h” # include & lt; opencv2/opencv.hpp> # include“opencv2/highgui/highgui.hpp” # include“opencv2/imgproc/imgproc.hpp” 使用名称空间的简历; 使用名称空间性病; 空白dealImg (char *路径) { 垫src=https://www.yisu.com/zixun/imread(路径);//结果图 垫dst;//显示原图 imshow(“原图”,src); cvtColor (dst src COLOR_RGB2GRAY);//高斯模糊,主要用于降噪 高斯模糊(dst, dst,大小(3、3),0); imshow(“高斯模糊图”,dst);//二值化图,主要将灰色部分转成白色,使内容为黑色 阈值(dst dst, 165年,255年,THRESH_BINARY); imshow(“阈值图”,dst);//中值滤波,同样用于降噪 medianBlur (dst dst 3); imshow (“medianBlur图”,dst);//腐蚀操作,主要将内容部分向高亮部分腐蚀,使得内容连接,方便最终区域选取 侵蚀(dst、dst垫(9 9 CV_8U)); imshow(“侵蚀图”,dst);//定义变量 vector比;轮廓; vector 层次结构; findContours (dst、轮廓、层次结构、RETR_CCOMP CHAIN_APPROX_SIMPLE); 垫的结果; for (int i=0;我& lt;hierarchy.size ();我+ +) { 矩形矩形=boundingRect (contours.at(我)); 矩形,矩形(src标量(255 255 0));//定义身份证号位置大于图片的一半,并且宽度是高度的6倍以上 如果(rect.y比;src。行/2,,rect.width/rect.height比;6) { 结果=src(矩形); imshow(“身份证号”,结果); } } imshow(“轮廓图”,src); } >之前 详细步骤:
<李>载入原图李> <李>将原图转为灰度图李> <李>使用高斯模糊进行第一次降噪李> <李>将图片二值化李> <李>使用中值滤波进行降噪李> <李>腐蚀操作,主要将内容部分向高亮部分腐蚀,使得内容连接,方便最终轮廓检测李> <李>轮廓检测,获得所有轮廓李> <李>定义身份证号位置大于图片的一半,并且宽度是高度的6倍以上,并剪裁该区域李>
<强>结果强>
对于身份证比较正的图片位置识别的还算是挺正确的,但是如果图片不正,那么第一步就应该对图片进行较正,无奈我是菜鸡。下面是网上搜的一个假身份证图片:
原图
轮廓检测图
剪裁结果图
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
Opencv获取身份证号码区域的示例代码