一、目标: 识别银行卡上的卡号
文章图片
二、思路: 一 、准备模板,能够与卡号数字样式进行模型匹配
文章图片
二、处理模板图片:将其分割成为单个数字的图片,和所对应的数字相匹配存储可迭代的数据类型中。
- 读入模板图片,并对模板图片进行灰度化,最后转换为二值图像
- 计算模板的轮廓,给轮廓排序(按照在银行卡上的位置),这里选择检索外轮廓,压缩水平的,垂直的和斜的部分
- 按照数字的顺序将每个数字的小图片存入列表
def cv_show(name,img):
cv2.imshow(name, img)
cv2.waitKey(0)
cv2.destroyAllWindows()
img = cv2.imread(args["template"]) #读入图片
# cv_show('img',img)
ref = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #对模板进行灰度化
# cv_show('ref',ref)
ref = cv2.threshold(ref,10,255,cv2.THRESH_BINARY_INV)[1]#转换为二值图像
# cv_show('ref',ref)
ref_, refCnts, hierarchy = cv2.findContours(ref.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE) #计算模板的轮廓
cv2.drawContours(img,refCnts,-1,(0,0,255),3)
# cv_show('img',img)
print(np.array(refCnts).shape)
refCnts = myutils.sort_contours(refCnts,method="left-to-right")[0] #给轮廓排序
digits = {}
for (i,c) in enumerate(refCnts):
(x,y,w,h) = cv2.boundingRect(c)
roi = ref[y:y+h,x:x+w]
roi = cv2.resize(roi,(57,88))
digits[i] = roi
#模板处理完成
文章图片
文章图片
文章图片
文章图片
如何给轮廓排序
1 先将轮廓的外接矩形画出
2 外接矩形会返回左上角点的坐标以及长和宽,利用横坐标进行排序
import cv2
#给轮廓排序的函数
def sort_contours(cnts, method="left-to-right"):
reverse = False
i = 0if method == "right-to-left" or method == "bottom-to-top":
reverse = Trueif method == "top-to-bottom" or method == "bottom-to-top":
i = 1
boundingBoxes = [cv2.boundingRect(c) for c in cnts] #用一个最小的矩形,把找到的形状包起来x,y,h,w
(cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),
key=lambda b: b[1][i], reverse=reverse))
# 这里的b:b[1][i]就是按照列表中的1号元素(也就是boundingBoxes)的第0号元素(坐标x)来进行排序
return cnts, boundingBoxes
def resize(image, width=None, height=None, inter=cv2.INTER_AREA):
dim = None
(h, w) = image.shape[:2]
if width is None and height is None:
return image
if width is None:
r = height / float(h)
dim = (int(w * r), height)
else:
r = width / float(w)
dim = (width, int(h * r))
resized = cv2.resize(image, dim, interpolation=inter)
return resized
sorted函数
文章图片
zip函数
zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。
如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表
>>>a = [1,2,3]
>>> b = [4,5,6]
>>> c = [4,5,6,7,8]
>>> zipped = zip(a,b)# 打包为元组的列表
[(1, 4), (2, 5), (3, 6)]
>>> zip(a,c)# 元素个数与最短的列表一致
[(1, 4), (2, 5), (3, 6)]
>>> zip(*zipped)# 与 zip 相反,*zipped 可理解为解压,返回二维矩阵式
[(1, 2, 3), (4, 5, 6)]
至此,所有的模板图片处理完毕
三、处理输出图片
第一步:读入图像,进行灰度化、二值化处理,调整图片的大小
第二步:为了突出比原轮廓亮的部分,使用顶帽操作处理图像,求图片的梯度,并进行求绝对值,归一化处理
第三步:我们需要找到包含银行卡号的小矩形,需要提取银行卡号所在小块的轮廓
- 闭运算(使文字,数字等融合成一块一块的)
- 二值转换(自适应阈值)
- 闭运算(消除白色块中的杂质)
到现在,图中有字的部分应该就是一块一块的了,我们现在要提取我们需要的块 - 求轮廓,在图像中画出轮廓
- 画出每个轮廓的外接矩形,返回左上角的坐标以及长与宽
- 根据长宽比与坐标值,筛选出我们需要的矩形框
image = cv2.imread(args["image"])
cv_show('image',image)
image = myutils.resize(image, width=300) #重新调整大小
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) #灰度操作
cv_show('gray',gray)
rectKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9, 3))
sqKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))
#--------------------------------------------------------------------------
tophat = cv2.morphologyEx(gray,cv2.MORPH_TOPHAT,rectKernel) #顶帽操作,突出轮廓较亮的部分
cv_show('tophat',tophat)
gradx = cv2.Sobel(tophat,ddepth=cv2.CV_32F,dx=1,dy=0,ksize=-1) #求梯度
gradx = np.absolute(gradx) #求绝对值
(min_val,max_val) = (np.min(gradx),np.max(gradx)) #归一化
gradx = 255*((gradx-min_val) / (max_val-min_val))
gradx = gradx.astype("uint8")
# print (np.array(gradx).shape)
cv_show('gradX_norm',gradx)
gradx = cv2.morphologyEx(gradx,cv2.MORPH_CLOSE,rectKernel)#闭操作,将数字融合在一起,所以这里要用比较大的核
cv_show('gradx',gradx)
thresh = cv2.threshold(gradx,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1] #二值转换
cv_show('thresh',thresh)
thresh = cv2.morphologyEx(thresh,cv2.MORPH_CLOSE,sqKernel) #再来一发闭操作,去除白字中的黑色杂质
cv_show('thresh',thresh)
thresh_,threshCnts,hierarchy = cv2.findContours(thresh.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts = threshCnts#提取图像的轮廓
cur_img = image.copy()
cv2.drawContours(cur_img,cnts,-1,(0,0,255),3)
cv_show('img',cur_img)
locs = []
for (i,c) in enumerate(cnts):
(x,y,w,h) = cv2.boundingRect(c)
ar = w/float(h)
if ar >2.5 and ar<4.0:
if (w>40 and w<55) and (h>10 and h<20):
locs.append((x,y,w,h))
locs = sorted(locs,key=lambda x:x[0]) #这里的x:x[0]就是按照列表中的0号元素来排序
#至此,银行卡号四部分的轮廓已经被提取出来了
文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
thresh = cv2.threshold
thresh = cv2.threshold(gradX, 0, 255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]至此,我们得到了银行卡上所有卡号所在的小块
参数说明, src表示输入的图片, thresh表示阈值, maxval表示最大值, type表示阈值的类型 type的类型
1.cv2.THRESH_BINARY 表示阈值的二值化操作,大于阈值使用maxval表示,小于阈值使用0表示
2. cv2.THRESH_BINARY_INV 表示阈值的二值化翻转操作,大于阈值的使用0表示,小于阈值的使用最大值表示
3. cv2.THRESH_TRUNC 表示进行截断操作,大于阈值的使用阈值表示,小于阈值的不变
4. cv2.THRESH_TOZERO 表示进行化零操作,大于阈值的不变,小于阈值的使用0表示
5. cv2.THRESH_TOZERO_INV 表示进行化零操作的翻转,大于阈值的使用0表示,小于阈值的不变
那么为什么这里的阈值为0呢? 因为我们进行二值处理时习惯于将阈值确定为127,但这个数值在有时候是不适用的,所以我们要用一种自适应的方法来确定阈值。 而Otsu就可以自己找到一个认为最好的阈值。并且Otsu非常适合于图像灰度直方图具有双峰的情况,他会在双峰之间找到一个值作为阈值,对于非双峰图像,可能并不是很好用。那么经过Otsu得到的那个阈值就是函数cv2.threshold的第一个参数了。因为Otsu方法会产生一个阈值,那么函数cv2.threshold的的第二个参数(设置阈值)就是0了,并且在cv2.threshold的方法参数中还得加上语句cv2.THRESH_OTSU。 什么是图像灰度直方图具有双峰的情况?
文章图片
四、我们要将所有小块中的每个数字取出,与模板进行匹配,得到银行卡号
- 我们将得到的4个小块(对应四块银行卡号)分别遍历,用每个块的位置信息得到原图像的灰度图中的相关区域图像(稍微扩大一些 )
- 对这些区域进行二值化处理,计算轮廓,并进行排序,得到每一个数字的图像
- 将单个数字与模板中的每一个数字进行匹配,得到最相似的模板图像所对应的索引就是该数字所对应的数字。
output = [] #银行卡号
for (i,(gX,gY,gW,gH)) in enumerate(locs):
groupOutput = []
group = gray[gY - 5:gY + gH + 5, gX - 5:gX + gW + 5]
cv_show('group',group) #显示第i个外接矩阵的图像
group = cv2.threshold(group,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv_show('group',group)
group_, digitCnts, hierarchy = cv2.findContours(group.copy(), cv2.RETR_EXTERNAL,
cv2.CHAIN_APPROX_SIMPLE)
digitCnts = contours.sort_contours(digitCnts,# 将第一个外界矩形中所有单个数字的轮廓排序
method="left-to-right")[0]
for c in digitCnts:
# 找到当前数值的轮廓,resize成合适的的大小
(x, y, w, h) = cv2.boundingRect(c)
roi = group[y:y + h, x:x + w]
roi = cv2.resize(roi, (57, 88))# 将每一个单个数字的轮廓调整为与模板相同的大小
cv_show('roi', roi) #现在我提取出了每个轮廓块中的每个字的轮廓了
#开始与模板匹配
scores = []
for (digit,digitROI) in digits.items():
result = cv2.matchTemplate(roi,digitROI,cv2.TM_CCOEFF)
(_,score,_,_) = cv2.minMaxLoc(result) #我们这里使用的方法需要的是最高得分
scores.append(score)
groupOutput.append(str(np.argmax(scores)))#返回这个数字与模板中所有数字匹配的10个得分的最大值的索引
cv2.rectangle(image,(gX-5,gY-5),(gX+gW+5,gY+gH+5),(0,0,255),2)
cv2.putText(image,"".join(groupOutput),(gX,gY-15),cv2.FONT_HERSHEY_SIMPLEX,0.65,(0,0,255),2)
output.extend(groupOutput)
【学习笔记|opencv实际案例(一)银行卡号的识别】cv2.putText函数
cv2.putText(img, str(i), (123,456), font, 2, (0,255,0), 3).join函数
- 各参数依次是:图片、添加的文字,左上角的坐标、字体、字体大小、颜色、字体粗细。
- img – 想要打印上文字的图像
- text – 想要打印的文字
- org – 文字的左下角坐标
- fontFace – 字体,可选的有:FONT_HERSHEY_SIMPLEX
string.join() 具体作用如下: join(): 连接字符串数组。将字符串、元组、列表中的元素以指定的字符(分隔符)连接生成一个新的字符串.对字典进行连接,只能将字典的键连接起来。.extend()函数
文章图片
.entend()与.append()都是给列表中添加元素,二者的区别:
lis.append(a)添加的是a这个整体,而lis.extend(a)会把a中的各个元素分开,a中的内容不再是一个整体
文章图片
三、完整代码
import cv2
import numpy as np
from imutils import contours
import myutils
import argparse #argparse是一个Python模块:命令行选项、参数和子命令解析器。
np.set_printoptions(threshold=np.inf)
ap = argparse.ArgumentParser() #第一步创建解析器
ap.add_argument("-i", "--image", required=True, #第二步添加参数
help="path to input image")
ap.add_argument("-t", "--template", required=True,
help="path to template OCR-A image")
args = vars(ap.parse_args())
#信用卡的类型
FIRST_NUMBER = {
"3": "American Express",
"4": "Visa",
"5": "MasterCard",
"6": "Discover Card"
}
'''
处理模板图像
第一步:读入模板图片,并对模板图片进行灰度化,最后转换为二值图像
第二步:计算模板的轮廓,给轮廓排序
第三步:按照数字的顺序将每个数字的小图片存入列表
'''
def cv_show(name,img):
cv2.imshow(name, img)
cv2.waitKey(0)
cv2.destroyAllWindows()
img = cv2.imread(args["template"]) #读入图片
cv_show('img',img)
ref = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #对模板进行灰度化
cv_show('ref',ref)
ref = cv2.threshold(ref,10,255,cv2.THRESH_BINARY_INV)[1]#转换为二值图像
cv_show('ref',ref)
ref_, refCnts, hierarchy = cv2.findContours(ref.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE) #计算模板的轮廓
cv2.drawContours(img,refCnts,-1,(0,0,255),3)
cv_show('img',img)
print(np.array(refCnts).shape)
refCnts = myutils.sort_contours(refCnts,method="left-to-right")[0] #给轮廓排序
digits = {}
for (i, c) in enumerate(refCnts): #i为数值,c为数值i对应得到轮廓
# 计算外接矩形并且resize成合适大小
(x, y, w, h) = cv2.boundingRect(c) #得到外接矩形
roi = ref[y:y + h, x:x + w] #将外接矩形这一块抠出来
cv_show('roi', roi)
roi = cv2.resize(roi, (57, 88)) # 每一个数字对应每一个数字的模板
digits[i] = roi
#模板处理完成
'''
对输入图像进行处理
第一步:读入图像,进行灰度化、二值化处理
第二步:为了突出比原轮廓亮的部分,使用礼帽操作处理图像
第三步:我们需要找到包含银行卡号的小矩形,需要提取银行卡号所在小块的轮廓
闭运算(使文字,数字等融合成块)
二值操作
闭运算(消除白色块中的杂质)
'''
image = cv2.imread(args["image"])
cv_show('image',image)
image = myutils.resize(image, width=300) #重新调整大小
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) #灰度操作
cv_show('gray',gray)
rectKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (9, 3))
sqKernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))
#--------------------------------------------------------------------------
tophat = cv2.morphologyEx(gray,cv2.MORPH_TOPHAT,rectKernel) #顶帽操作,突出轮廓较亮的部分
cv_show('tophat',tophat)
gradx = cv2.Sobel(tophat,ddepth=cv2.CV_32F,dx=1,dy=0,ksize=-1) #求梯度
gradx = np.absolute(gradx) #求绝对值
(min_val,max_val) = (np.min(gradx),np.max(gradx)) #归一化
gradx = 255*((gradx-min_val) / (max_val-min_val))
gradx = gradx.astype("uint8")
# print (np.array(gradx).shape)
cv_show('gradX_norm',gradx)
#---------------------------------------------------------------------------------
gradx = cv2.morphologyEx(gradx,cv2.MORPH_CLOSE,rectKernel)#闭操作,将数字融合在一起,所以这里要用比较大的核
cv_show('gradx',gradx)
thresh = cv2.threshold(gradx,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1] #二值转换
cv_show('thresh',thresh)
thresh = cv2.morphologyEx(thresh,cv2.MORPH_CLOSE,sqKernel) #再来一发闭操作,去除白字中的黑色杂质
cv_show('thresh',thresh)
thresh_,threshCnts,hierarchy = cv2.findContours(thresh.copy(),cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnts = threshCnts#提取图像的轮廓
cur_img = image.copy()
cv2.drawContours(cur_img,cnts,-1,(0,0,255),3)
cv_show('img',cur_img)
locs = []
for (i,c) in enumerate(cnts):
(x,y,w,h) = cv2.boundingRect(c)
ar = w/float(h)
if ar >2.5 and ar<4.0:
if (w>40 and w<55) and (h>10 and h<20):
locs.append((x,y,w,h))
locs = sorted(locs,key=lambda x:x[0]) #这里的x:x[0]就是按照列表中的0号元素来排序
#至此,银行卡号四部分的轮廓已经被提取出来了
'''
遍历4个轮廓块
提取出每一块轮廓中的每个数字
'''
output = [] #银行卡号
for (i,(gX,gY,gW,gH)) in enumerate(locs):
groupOutput = []
group = gray[gY - 5:gY + gH + 5, gX - 5:gX + gW + 5]
cv_show('group',group) #显示第i个外接矩阵的图像
group = cv2.threshold(group,0,255,cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
cv_show('group',group)
group_, digitCnts, hierarchy = cv2.findContours(group.copy(), cv2.RETR_EXTERNAL,
cv2.CHAIN_APPROX_SIMPLE)
digitCnts = contours.sort_contours(digitCnts,# 将第一个外界矩形中所有单个数字的轮廓排序
method="left-to-right")[0]
for c in digitCnts:
# 找到当前数值的轮廓,resize成合适的的大小
(x, y, w, h) = cv2.boundingRect(c)
roi = group[y:y + h, x:x + w]
roi = cv2.resize(roi, (57, 88))# 将每一个单个数字的轮廓调整为与模板相同的大小
cv_show('roi', roi) #现在我提取出了每个轮廓块中的每个字的轮廓了
#开始与模板匹配
scores = []
for (digit,digitROI) in digits.items():
result = cv2.matchTemplate(roi,digitROI,cv2.TM_CCOEFF)
(_,score,_,_) = cv2.minMaxLoc(result) #我们这里使用的方法需要的是最高得分
scores.append(score)
groupOutput.append(str(np.argmax(scores)))#返回这个数字与模板中所有数字匹配的10个得分的最大值的索引
cv2.rectangle(image,(gX-5,gY-5),(gX+gW+5,gY+gH+5),(0,0,255),2)
cv2.putText(image,"".join(groupOutput),(gX,gY-15),cv2.FONT_HERSHEY_SIMPLEX,0.65,(0,0,255),2)
output.extend(groupOutput)
print("银行卡的账号是:{}".format("".join(output)))
cv_show("image",image)
import cv2def sort_contours(cnts, method="left-to-right"):
reverse = False
i = 0if method == "right-to-left" or method == "bottom-to-top":
reverse = Trueif method == "top-to-bottom" or method == "bottom-to-top":
i = 1
boundingBoxes = [cv2.boundingRect(c) for c in cnts] #用一个最小的矩形,把找到的形状包起来x,y,h,w
(cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),
key=lambda b: b[1][i], reverse=reverse))return cnts, boundingBoxes
def resize(image, width=None, height=None, inter=cv2.INTER_AREA):
dim = None
(h, w) = image.shape[:2]
if width is None and height is None:
return image
if width is None:
r = height / float(h)
dim = (int(w * r), height)
else:
r = width / float(w)
dim = (width, int(h * r))
resized = cv2.resize(image, dim, interpolation=inter)
return resized
四、收获 在对图像进行截取的时候很疑惑,为什么要扩大一点用减法呢?原来是因为图像中的坐标系和我想的不一样
文章图片
顶帽操作有突出轮廓较亮部分的作用。
闭运算可以将文字啊数字啊什么的与背景不同颜色的东西融合,也可以消除白色块(背景是黑色)中的杂质。
二值转换并不是所有的阈值都是127,有时候要进行自适应的阈值设定。
推荐阅读
- AI遮天传|openCV第三篇
- opencv|C++ OpenCV霍夫变换--圆检测
- OpenCV|【OpenCV + Qt】 制作视频播放器
- opencv|【OpenCV】 人脸识别
- 机器学习笔记之二(2.2)
- OpenCV|OpenCV人脸识别
- opencv|Opencv简单实现对某颜色范围物体的识别
- 微软相关|C#的架构、框架、设计模式
- 图像处理|信用卡数字识别(opencv,代码分析)