opencv|OpenCV(02基础知识和绘制图形)


文章目录

  • OpenCV的色彩空间
    • RGB和BGR
    • `HSV`,`HSL`和`YUV`
      • `HSV(HSB)`
      • `HSL`
      • `YUV`
  • 颜色空间的转化
  • OpenCV的一种重要数据结构——Mat
    • Mat介绍
    • Mat拷贝
    • 访问图像(Mat)的属性
    • 图像通道的分割和合并
  • 绘制图形
    • 绘制直线
    • 绘制矩形
    • 绘制圆
    • 绘制椭圆
    • 绘制多边形
    • 绘制一个填充的多边形
    • 绘制文本
  • 作业

OpenCV的色彩空间 RGB和BGR 最常见的色彩空间就是RGB,人眼也是基于RGB的色彩空间去分辨颜色的
OpenCV默认使用的是BGRBGRRGB色彩空间的区别在于图片在色彩通道上的排列顺序不同
显示图片时要注意适配图片的色彩空间和显示环境的色彩空间:比如传入的图片是BGR色彩空间,显示环境是RGB色彩空间,就会出现颜色混乱的情况
opencv|OpenCV(02基础知识和绘制图形)
文章图片

HSV,HSLYUV HSV(HSB)
OpenCV用的最多的色彩空间就是HSV
  • Hue:色相,即色彩,如红色、蓝色,用角度来度量,取值范围为0°~360°,从红色开始按照逆时针方向计算,红色为0°,绿色为120°,蓝色为240°
  • Saturation:饱和度, 表示颜色接近光谱色的程度。一种颜色,可以看成是某种光谱色与白色混合的结果。其中光谱色所占的比例愈大,颜色接近光谱色的程度就愈高,颜色的饱和度也就愈高。饱和度高,颜色则深而艳。光谱色的白光成分为0,饱和度达到最高。通常取值范围为0%~100%,值越大,颜色越饱和。
  • Value(brightness): 明度. 明度表示颜色明亮的程度,对于光源色,明度值与发光体的光亮度有关;对于物体色,此值和物体的透射比或反射比有关。通常取值范围为0%(黑)到100%(白)。
    opencv|OpenCV(02基础知识和绘制图形)
    文章图片

    为什么要使用HSV?
方便OpenCV做图像处理.比如根据hue的值就可以判断背景颜色.
HSL
HSLHSV差不多
  • Hue: 色相
  • Saturation: 饱和度
  • Lightness: 亮度
HSL在顶部是纯白的, 不管是什么颜色.
HSLHSV的区别
opencv|OpenCV(02基础知识和绘制图形)
文章图片

opencv|OpenCV(02基础知识和绘制图形)
文章图片

理解:
opencv|OpenCV(02基础知识和绘制图形)
文章图片

YUV
YUV是一种颜色编码方法。常使用在各个视频处理组件中。 YUV在对照片或视频编码时,考虑到人类的感知能力,允许降低色度的带宽(因为我们人眼分不出太多的颜色,因此可以节约带宽)
  • Y”表示明亮度(Luminance或Luma),也就是灰阶值,以前的黑白电视就是只用Y调整灰度即可
  • U”和“V”表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。
Y'UV的发明是由于彩色电视与黑白电视的过渡时期。
Y'UV最大的优点在于只需占用极少的带宽。
  • 4:4:4表示完全取样。
  • 4:2:2表示2:1的水平取样,垂直完全采样。
  • 4:2:0表示2:1的水平取样,垂直2:1采样。
  • 4:1:1表示4:1的水平取样,垂直完全采样。
opencv|OpenCV(02基础知识和绘制图形)
文章图片

每4个Y只有——>2个U或者2个V
颜色空间的转化 关键API cv2.cvtColor()
# 关键API cv2.cvtColor() import cv2# 定义一个回调函数callback——> 我们要使用trackbar滑块 def callback(value): pass # 我们不需要功能实现 因此直接pass# 创建窗口 cv2.namedWindow('color',cv2.WINDOW_NORMAL) cv2.resizeWindow('color',640,480)# 读取图片 ——> opencv读进来的格式默认是BGR的色彩空间 img = cv2.imread('./cat.jpeg')# 定义颜色空间转化列表 color_spaces = [ # 记忆:所有颜色空间的转化都是以"COLOR"开头的 cv2.COLOR_BGR2RGBA , cv2.COLOR_BGR2BGRA ,# BGRA中的‘A’表示透明度 cv2.COLOR_BGR2GRAY , cv2.COLOR_BGR2HSV , cv2.COLOR_BGR2YUV ]# 设置一个trackbar滑块 cv2.createTrackbar('trackbar' , 'color' , 0 , 4 , callback) # (trackbar的名字,在哪个窗口上实现,默认值,最大值)# 不停地循环展示窗口 while True: # 获取trackbar的值 ——> 转换成索引(用于选择颜色空间转换的形式) index = cv2.getTrackbarPos('trackbar','color') # (trackbar的名字,窗口的名字)# 进行颜色空间转化 ——> 把我们的img图片转换成对应的色彩 cvt__img = cv2.cvtColor( img , color_spaces[index] )# 展示图片 cv2.imshow('color' , cvt__img)# 退出的条件 key = cv2.waitKey(1) if key == ord('q') or key == ord('Q'): break# 消除窗口 cv2.destroyAllWindows()

OpenCV的一种重要数据结构——Mat Mat介绍 【opencv|OpenCV(02基础知识和绘制图形)】Mat是OpenCV在C++语言中用来表示图像数据的一种数据结构,在python中转化为numpy的darray
  • Mat由指针hearder和数据data组成
opencv|OpenCV(02基础知识和绘制图形)
文章图片

Mat拷贝 在python中Mat数据对应numpy的ndarray,使用numpy提供的深浅拷贝方法可以实现对Mat的拷贝
# 关于深浅拷贝 # 浅拷贝:仅仅是复制出一个“指针”,共同指向一份data数据 ——> data数据发生改变,浅拷贝的数据也会改变 # 深拷贝:完全复制出一份和原始数据一样的数据(包括data)——> data数据发生改变,深拷贝的数据不会发生改变!# 因为在python中,图片数据已经包装成ndarray,而非mat # 因此对ndarray的深浅拷贝 ——> 就是对mat的深浅拷贝import cv2 import numpy as npcv2.namedWindow('img',cv2.WINDOW_NORMAL) cv2.resizeWindow('img',480,640)# 读入图片 img = cv2.imread('./cat.jpeg') # 浅拷贝 img2 = img.view() # 其底层数据的内存地址是一样的,仅仅是名字不一样而已# 深拷贝 img3 = img.copy() # 改变图片中某个位置的颜色,便于观察深浅拷贝结果 img[10:100,10:100] = [0,0,255] # 把img图像上[10:100,10::100]的位置颜色改为红色[0,0,255]# 展示图片 ——> 我们让图片一起显示出来 np.hstack()使图像横向堆叠 ;np.vstack()使图像纵向堆叠 cv2.imshow( 'img' , np.hstack( (img,img2,img3) ) )# 退出的条件 cv2.waitKey(0) cv2.destroyAllWindows()

结果:

我们发现前两张图片的颜色给改了,而最后一张图片的颜色没有被修改——> 因为前两个是浅拷贝,所以它们的底层数据是一样的,而最后一个是深拷贝,是一份独立的数据
访问图像(Mat)的属性 opencv的Mat在python中已经转换成了ndarray,通过ndarray的属性即可访问Mat图像的属性
import cv2 import numpy as npimg = cv2.imread('./cat,jpeg')# shape 属性中包含了三个信息 # 高度、长度、通道数 print(img.shape)# 图像占用空间计算 # 高度×长度×通道数 print(img.size)# 图像中每一个图像的位深 print(img.dtype)

图像通道的分割和合并
  • split(mat)分割图像的色彩通道
  • merge((ch1,ch2,ch3......))融合多个色彩通道
# 图像的分割与融合 import cv2 import numpy as np# 导入一个全黑的图片 img = np.zeros((200,200,3),np.uint8)# 分割通道 ——> 得到原图中三个通道的值 b , g , r = cv2.split(img)# 修改颜色:分别改变b蓝色通道和g绿色通道的一小段数据 b[10:100 , 10:100] = 255 g[10:100 , 10:100] = 255# 合并色彩通道 ——> 相当于创建一个新的图片(注意括号内要写元组,并且要按照BGR的顺序写入) img2 = cv2.merge((b,g,r))cv2.imshow('img',np.hstack((img,img2)))# 我们也顺便展示一下b,g修改后的值,方便理解 cv2.imshow('b_and_g',np.hstack((b,g)))cv2.waitKey(0) cv2.destroyAllWindows()

结果:
先看色彩通道b色彩通道g修改后的样子(我们将两幅图横向拼接在了一起)
opencv|OpenCV(02基础知识和绘制图形)
文章图片

由于我们创建的是全黑的图img = np.zeros((200,200,3),np.uint8),因此图像是全黑的,而我们把 [10:100 , 10:100] 区域内的值拉到最大,因此该区域就变白了
对应在新生成的图上
opencv|OpenCV(02基础知识和绘制图形)
文章图片

左半部分是修改前:全黑
右半部分是将修改后的色彩通道重新叠加:由于我们把b蓝色通道g绿色通道的部分值拉满了,对应蓝色和绿色的合成色即为上图的颜色
绘制图形 利用OpenCV提供的绘制图形API可以轻松地在图像上绘制各种图形,比如直线、矩形、圆、椭圆等图形
绘制直线 line(img, pt1, pt2, color, thickness, lineType, shift) 画直线
  • img::在哪个图像上画线
  • pt1, pt2: 开始点, 结束点. 指定线的开始与结束位置
  • color::颜色
  • thickness: 线宽
  • lineType: 线型.线型为-1, 4, 8, 16, 默认为8
  • shift: 坐标缩放比例.
# 绘制直线 import cv2 import numpy as np# 创建一个纯黑的背景图 用于画图 img = np.zeros((480,640,3),np.uint8)# 画一条直线:line(img, pt1, pt2, color, thickness, lineType, shift) ——> 位置参数pt1、pt2,颜色color必须为元组形式 cv2.line(img,(10,20),(300,400),(0,0,255),5,4) cv2.line(img,(10,20),(400,700),(0,0,255),5,18)# lineType越小,线的锯齿状越明显,且值必须是2的幂次方# 展示图片 cv2.imshow('draw',img) cv2.waitKey(0) cv2.destroyAllWindows()

结果:
opencv|OpenCV(02基础知识和绘制图形)
文章图片

绘制矩形 rectangle(img, pt1, pt2, color, thickness, lineType, shift) 参数同上— 画矩形
# 绘制矩形 import cv2 import numpy as np# 创建一个纯黑的背景图 用于画图 img = np.zeros((480,640,3),np.uint8)# 画一个矩形:(和画直线的参数一样 cv2.rectangle(img,(80,200),(300,400),(0,0,255),5,4) cv2.rectangle(img,(100,200),(200,300),(0,255,255),5,18)# lineType越小,线的锯齿状越明显,且值必须是2的幂次方# 展示图片 cv2.imshow('draw',img) cv2.waitKey(0) cv2.destroyAllWindows()

结果:
opencv|OpenCV(02基础知识和绘制图形)
文章图片

注意:
如果想填充矩形框,使之变成实心矩形,只需要将thickness = -1即可
# 绘制矩形 import cv2 import numpy as np# 创建一个纯黑的背景图 用于画图 img = np.zeros((480,640,3),np.uint8)# 画一个矩形:(和画直线的参数一样 cv2.rectangle(img,(80,200),(300,400),(0,0,255),5,4) cv2.rectangle(img,(100,200),(200,300),(0,255,255),5,18)# lineType越小,线的锯齿状越明显,且值必须是2的幂次方img2 = img.copy() cv2.rectangle(img2,(80,200),(300,400),(0,0,255),-1,4) cv2.rectangle(img2,(100,200),(200,300),(0,255,255),-1,18)# lineType越小,线的锯齿状越明显,且值必须是2的幂次方 # 展示图片 cv2.imshow('draw',np.hstack((img,img2))) cv2.waitKey(0) cv2.destroyAllWindows()

结果:
opencv|OpenCV(02基础知识和绘制图形)
文章图片

绘制圆 circle(img, center, radius, color[, thickness[, lineType[, shift]]]) :中括号内参数表示可选参数
  • center:圆形坐标
  • radius:半径
# 绘制圆 import cv2 import numpy as np# 创建一个纯黑的背景图 用于画图 img = np.zeros((480,640,3),np.uint8)img2 = img.copy() # 画一个圆:需要传入圆心、半径 cv2.circle(img,(320,240),100,(0,150,255),10) # 中括号[]内的参数可以不写,有默认值 # 展示图片 cv2.imshow('draw',img) cv2.waitKey(0) cv2.destroyAllWindows()

结果:
opencv|OpenCV(02基础知识和绘制图形)
文章图片

注意:和绘制矩形一样,如果想要画出一个实心的圆,只需要让thickness = -1即可
# 绘制圆 import cv2 import numpy as np# 创建一个纯黑的背景图 用于画图 img = np.zeros((480,640,3),np.uint8)img2 = img.copy() # 画一个圆:需要传入圆心、半径 cv2.circle(img,(320,240),100,(0,150,255),10) # 中括号[]内的参数可以不写,有默认值 cv2.circle(img2,(320,240),100,(0,150,255),-1) # 中括号[]内的参数可以不写,有默认值 # 展示图片 cv2.imshow('draw',np.hstack((img,img2))) cv2.waitKey(0) cv2.destroyAllWindows()

结果:
opencv|OpenCV(02基础知识和绘制图形)
文章图片

绘制椭圆 关键API:ellipse(img, center, axes, angle, startAngle, endAngle, color[, thickness[, lineType[, shift]]])
  • img:图像
  • center:椭圆圆心 ——> 用元组表示
  • axes:是轴axis的复数,表示横轴X,纵轴Y的长短——>X在前Y在后 (用元组表示)
  • angle:椭圆的角度(顺时针偏转)
  • startAngle&endAngle:控制显示的角度,如果是0,360表示显示整个椭圆(椭圆是从右顶点开始顺时针画的)
opencv|OpenCV(02基础知识和绘制图形)
文章图片

# 绘制椭圆 import cv2 import numpy as np# 创建一个纯黑的背景图 用于画图 img = np.zeros((480,640,3),np.uint8)# 画一个圆:需要传入圆心、半径 # ellipse(img, center, axes, angle, startAngle, endAngle, color[, thickness[, lineType[, shift]]]) # ellipse(img, 中心点, 长宽的一半, 角度, 从哪个角度开始, 从哪个角度结束,...) cv2.ellipse(img,(320,240),(100,50),0,0,360,(0,0,255)) # 中括号[]内的参数可以不写,有默认值# 展示图片 cv2.imshow('draw',img) cv2.waitKey(0) cv2.destroyAllWindows()

角度为0°,从0-360
opencv|OpenCV(02基础知识和绘制图形)
文章图片

角度为0°,从0-180
opencv|OpenCV(02基础知识和绘制图形)
文章图片

角度为45°,从0-360
opencv|OpenCV(02基础知识和绘制图形)
文章图片

绘制多边形 polylines(img, pts, isClosed, color[, thickness[, lineType[, shift]]]) 画多边形
  • pts:points的简写,是多边形的点集,并且这个点集必须是有符号32位的整形
  • isClosed:图形是否闭合
# 绘制多边形 import cv2 import numpy as np# 创建一个纯黑的背景图 用于画图 img = np.zeros((480,640,3),np.uint8)# 绘制多边形 #polylines(img, pts, isClosed, color[, thickness[, lineType[, shift]]]) 画多边形 pts = np.array([(300,10),(150,100),(450,100)],np.int32) # 创建多边形的点集pts cv2.polylines(img,[pts],True,(0,0,255),5,16) # 注意参数格式!!!pts要用"[]"# 展示图片 cv2.imshow('draw',img) cv2.waitKey(0) cv2.destroyAllWindows()

结果:
曲线闭合isClosed = True
opencv|OpenCV(02基础知识和绘制图形)
文章图片

曲线闭合isClosed = False
opencv|OpenCV(02基础知识和绘制图形)
文章图片

绘制一个填充的多边形 fillPoly(img, pts, color[, lineType[, shift[, offset]]]) 画填充多边形(函数名P要大写!)
# 绘制多边形 import cv2 import numpy as np# 创建一个纯黑的背景图 用于画图 img = np.zeros((480,640,3),np.uint8)# 绘制多边形 #polylines(img, pts, isClosed, color[, thickness[, lineType[, shift]]]) 画多边形 pts = np.array([(300,10),(150,100),(450,100)],np.int32) # 创建多边形的点集pts cv2.fillPoly(img,[pts],False,(0,0,255),5,16) # 注意参数格式!!!pts要用"[]"# 展示图片 cv2.imshow('draw',img) cv2.waitKey(0) cv2.destroyAllWindows()

opencv|OpenCV(02基础知识和绘制图形)
文章图片

注意: 如果是绘制等腰矩形这些规则形状的图形,pts中的点集一定要按顺时针或者逆时针顺序写入,否则无法绘制出目标图形
绘制文本 putText(img, text, org, fontFace, fontScale, color[, thickness[, lineType[, bottomLeftOrigin]]]) 绘制文本
其中:
  • text :要绘制的文本
  • org :文本框在图片中的左下角坐标
  • fontFace :字体类型(即字体)
  • fontScale :字体大小
# 绘制多边形 import cv2 import numpy as np# 创建一个纯黑的背景图 用于画图 img = np.zeros((480,640,3),np.uint8)# 绘制文本putText(img, text, org, fontFace, fontScale, color[, thickness[, lineType[, bottomLeftOrigin]]]) 绘制文本 cv2.putText(img, 'Hello OpenCV' , (50,400) , cv2.FONT_HERSHEY_COMPLEX , 2,[0,0,255])# 注意!opencv只能显示英文字体-没有中文字体的包# 展示图片 cv2.imshow('draw',img) cv2.waitKey(0) cv2.destroyAllWindows()

opencv|OpenCV(02基础知识和绘制图形)
文章图片

如果想在系统图片上显示文本,则只用修改img = np.zeros((480,640,3),np.uint8) # 创建全黑图为——> 导入系统中的图img = cv2.imread('./cat.jpeg')即可
如果我们想在图片上展示中文字体,由于OpenCV没有方法来绘制中文,需要借助其他的包 ——> pillow
该方法和opencv没啥关系…
# 安装pillow import cv2 import numpy as np from PIL import ImageFont, ImageDraw, Image# 生成一张纯白的图片 img = np.full((200, 200, 3), fill_value=https://www.it610.com/article/255, dtype=np.uint8)# 定义字体路径(有点多余说实话...) ——> 在我们的电脑C盘-Windows-Fonts-找到对应的文件拷贝到当前目录下 font_path = 'msyhbd.ttc' # 拷贝的字体文件# 导入字体文件 my_font = ImageFont.truetype(font_path, 30) # 30为字体大小fontscal# 创建一个pillow的图片 img_pil = Image.fromarray(img)# 绘制该图片 draw = ImageDraw.Draw(img_pil)# 利用draw绘制中文 draw.text((10, 150), '绘制中文', font=my_font, fill=(0, 255, 0, 0))# 将格式重新变回ndarray,这样才能用opencv的工具cv2.imshow去显示 img = np.array(img_pil)# 中文会显示问号 cv2.putText(img, '中文', (10, 100), cv2.FONT_HERSHEY_SIMPLEX, 1, (255, 0, 0), 1)cv2.imshow('img', img) cv2.waitKey(0) cv2.destroyAllWindows()

opencv|OpenCV(02基础知识和绘制图形)
文章图片

作业 写一个程序, 实现按L键之后拖动鼠标绘制直线, 按R键之后拖动鼠标绘制矩形, 按C键拖动鼠标绘制圆形
# opencv控制鼠标 import cv2 import numpy as np import math# 设置此时画图的模式,由按键可改变 mode = 0 # 模式1:画直线模式2:画矩形模式3:画圆# 定义鼠标的回调函数(函数名可以随便取,但是参数必须是五个!) def mouse_callback(event,x,y,flags,userdata): # event:鼠标事件;xy:鼠标坐标;flags:鼠标的组合操作;userdata:传给用户的数据 global x_start,y_start# 要定义为全局!否则cv2.line()中读取不了#print(event,x,y,flags,userdata)# 增加功能:按下鼠标右键退出 if event == 2: cv2.destroyAllWindows() # 窗口会闪一下 然后继续出现,其实我们是运行成功了,只不过下方是个死循环,会一直存在# 增加功能:按下‘L’键后拖动鼠标绘制直线 (按下时记录此时鼠标的坐标—> 直线起点 松手时记录此时鼠标的坐标 —> 终点) if mode == 1 and event == cv2.EVENT_LBUTTONDOWN:# 如果此时 "L" 被按下且鼠标左键也被按下没有松开 x_start,y_start = x,y # 记录此时的鼠标位置 —> 起始elif mode == 1 and event == cv2.EVENT_MOUSEMOVE and flags == cv2.EVENT_FLAG_LBUTTON:# 在上面if按下左键的基础上,如果鼠标被拖动(event == cv2.EVENT_MOUSEMOVE)并且是左键(cv2.EVENT_FLAG_LBUTTON) # 注意我们没有用到左键松开的事件!这可以让我们的笔迹跟随着鼠标,而不是单纯的拖动后才出现笔迹 #x_end,y_end = x,y # 记录此时的鼠标位置 —> 终止 print("正在绘制直线!") cv2.line(img, (x_start,y_start), (x,y), [255,0,255], 5, 16) # 画直线 #cv2.line(img, (x_start,y_start), (x_end,y_end ), [0,255,255], 5, 16) # 记不记录终点信息都可以:我们时一直循环展示图片# 增加功能:按下‘R’键后拖动鼠标绘制矩形 if mode == 2 and event == cv2.EVENT_LBUTTONDOWN:# 如果此时 "R" 被按下且鼠标左键也被按下没有松开 x_start,y_start = x,y # 记录此时的鼠标位置 —> 起始elif mode == 2 and event == cv2.EVENT_MOUSEMOVE and flags == cv2.EVENT_FLAG_LBUTTON:# 在上面if按下左键的基础上,如果鼠标被拖动(event == cv2.EVENT_MOUSEMOVE)并且是左键(cv2.EVENT_FLAG_LBUTTON) print("正在绘制矩形!") cv2.rectangle(img, (x_start,y_start), (x,y), [0,255,255], -5, 16) # 画矩形# 增加功能:按下‘C’键后点击图片,生成以点击位置为圆形,半径固定的圆 if mode == 3 and event == cv2.EVENT_LBUTTONDOWN:# 如果此时 "R" 被按下且鼠标左键也被按下没有松开 x_start,y_start = x,y # 记录此时的鼠标位置 —> 起始elif mode == 3 and event == cv2.EVENT_MOUSEMOVE :# 在上面if按下左键的基础上,如果鼠标被拖动(event == cv2.EVENT_MOUSEMOVE)并且是左键(cv2.EVENT_FLAG_LBUTTON) print("正在绘制圆!") cv2.circle(img,( x_start,y_start),50,(255,255,255))# 创建窗口 cv2.namedWindow('mouse',cv2.WINDOW_NORMAL) cv2.resizeWindow('mouse',640,360) # 宽度(列)和高度(行)# 设置鼠标的回调函数 cv2.setMouseCallback('mouse',mouse_callback,'123') # '123'为用户数据,会传到上方的参数userdata中 # 在我们生成的mouse的窗口上,做任何鼠标的操作,它都会去执行我们定义的mouse_callback()函数# 生成一个全黑的图片(先行后列——> 要和上面反过来) img = np.zeros((360,640,3),np.uint8) # np.zeros()生成全是0的图片np.uint8表示0-255 u表示无符号# 循环展示图片 while True: cv2.imshow('mouse',img) # 展示刚才生成的全黑图片# 用变量 "key" 来接受我们在键盘上按下的按键 key = cv2.waitKey(1)if key == ord('q') or key == ord('Q'): breakelif key == ord('l') or key == ord('L'): # 按下键盘上的 "L" 键,开始画直线 mode = 1 # 模式1:画直线elif key == ord('r') or key == ord('R'): # 按下键盘上的 "R" 键,开始画矩形 mode = 2 # 模式2:画矩形elif key == ord('c') or key == ord('C'): # 按下键盘上的 "C" 键,开始画矩形 mode = 3 # 模式3:画圆cv2.destroyAllWindows()

结果:opencv|OpenCV(02基础知识和绘制图形)
文章图片

怎么拖动鼠标画圆我还搞不出来目前实现的是点击屏幕,以点击位置为圆心,画出一个固定半径的圆

    推荐阅读