基于MATLAB深度学习的交通标志识别
- 课题介绍
- 课题研究现状
上述这些方法都能在特定的应用情况下取得较好的识别效果, 然而只是基于形状和颜色特征或者只是依靠一些人工提取的单一 特征如不变矩特征、中心投影特征、SIFT特征还是有些研究者采用的小波矩特征[9-10]等等来训练识别网络,这些都易忽视图像的内在的很多细节,而往往这些细节正是区别不同图像的关键。与这些方法相比本文采用的深度学习方法的优点是该方法不需要任何人工 特征,它能直接以图像的像素作为输入,通过深层次结构自动学习获得图像更抽象的特征表述。
- 深度学习简介
Regression)等[11]。但到2006年,这一局面因为机器学习领域泰斗, 加拿大多伦多大学教授Hinton在《Science》上发表的一篇文章而被打破[12],从此掀起了深度学习在学术界和工业界的浪潮。深度学习的概念源于人工神经网络的研究,是无监督学习的一种,其动机在于建立,模拟人脑进行分析学习的神经网络,该网络能通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习在图像识别、语音识别和自然语言处 理等方面都得到了很大的发展。1898年深度学习首次由LeCun和他的同事尝试应用于图像识别领域,并取得了很大成功,其采用的是一种带有卷积结构的深度神经网络 — 卷积神经网络(Convolution Neural Networks,CNN)[13]。近年来,在图像识别领域研究者们的不懈努力及创新下,越来越多的深度学习模型及其变种应用于图像识别的成果被公布于众。本文交通标志的识别 采用的MPCNN就是CNN的一种变形模型[14]。
- 具体实现
4.1、MPCNN结构及原里
1962年Hubel和Wiesel通过对猫视觉皮层细胞的研究,提出了感受野(receptive field)的概念,并运用于卷积神经网络[15],传统的卷积神经网络是一个多层的神经网络,每层由多个二维平面组成, 而每个平面又由多个独立的神经元组成,各层之间共享权值。一般分为卷积层(C层)和采样层(S层)。C层的每个神经元的输入与前一层的局部感受野相连,并提取改局部的特征。S层用来求局部平均与二次提取,这种特有的两次特征提取结构使网络在识别时对输入样本有较高的畸变容忍能力。MPCNN在传统CNN的基础上将S层的采样方法变换成求局部最大值,这样大大减少了提取上层不变特征时的计算复杂度。如式(1)所示。
文章图片
其中,样本图像大小为N×N,感受野是一个n×n的小窗口,该窗口可以是小于图像大小的任意大小,ai是感受野内采样前的像素。
文章图片
图 1 实验所用MPCNN 结构图
文章图片
图 2 部分样本图
表 1 各类交通标志样本数及识别率
文章图片
点值,它们通过一个窗口函数u(x,y)(通常采用的是sigmoid函数)后再取最大值就得到一个像素点值aj,这样这个邻域内n×n个像素就变成了一个像素,感受野在图像上逐像素滑动后就产生了一个大小缩小了n2倍的特征映射图。本文采用的MPCNN结构及各层神经元数如图1所示,该结构对我们的数据集是最佳的。
输入的是一个大小为46×46的原始图像的灰度图像。6个大小为7×7的不同卷积核分别与该图像卷积后得到含有6个大小为40×
40的特征图的卷积层C1,C1层通过大小为2×2的最大采样池亚采 样求最大值后将特征图的大小分别降为20×20得到采样层S2。S2层的特征映射图再通过16个大小为7×7的卷积核卷积后得到含有16 个大小为14×14的特征图的C3层。C3层通过2×2的最大池采样后得到S4层,该层含有16个大小为7×7的特征映射图。对S4层的特征 映射图用340个大小为7×7的卷积核进行卷积就得到了C5层包含
340个1×1的特征图。C5层到F6层是全连接的,F6层含有100个神经个神经元,网络就是通过最后13个输出神经元的不同反应来判断输入的是哪类交通标志完成对交通标志的最终识别。
我们主要在深圳,广州城区道路上对13种常见的户外交通标志进行了采集,其中按形状分包含了圆形、三角形、正六边形和正方形标志,按颜色划分有红色禁令标志和蓝色指示标志。总样本数5780 个,包含了自然场景中交通标志可能出现的各种情况如掉色,光照不均,遮挡,形变等等,部分样本如图(2)所示。
其中,随机选取了3460个作为训练样本,其余2320个作为测试样本。网络采用的是梯度下降法训练,迭代10次后网络收敛,如图
3所示是训练好的识别网络MPCNN对测试样本进行识别时各卷积层、采样层的特征图和所用的卷积核。各样本数及识别结果如表1 所示。部分误识别都是由于形变太大,遮挡过多、光照太暗或反光造成。
- 结论
很大的提升和改进空间。同时,在实际应用时,为了提高网络的鲁棒性,应需要更大量的训练样本。
【卷积|基于深度学习的道路交通标志数字识别】
推荐阅读
- Python从零到壹|[Python从零到壹] 五十.图像增强及运算篇之图像直方图理论知识和绘制实现
- CS224W|CS224W-图神经网络 笔记4.3(Community Structure in Networks - 网络中重叠社区的挖掘——BigCLAM 算法)
- 深度学习|波士顿房价预测
- 面经题库|2022 深度学习 & 计算机视觉 & 感知算法 面经整理 二十三(221 222 223 224 225 226 227 228 229 230)
- 人工智能|软件业自由之神---Richard Stallman
- AI遮天传|openCV第三篇
- 算法|RTC 场景下的屏幕共享优化实践
- spring|Spring Boot 实现接口幂等性的 4 种方案
- opencv|C++ OpenCV霍夫变换--圆检测