平均池化和最大池化适用场景 【计算机视觉|平均池化和最大池化分别适用于什么场景呢()】平均池化和最大池化分别适用于什么场景呢?
在卷积神经网络中,池化操作主要有两种。其中一个是,最大池化(MaxPooling);另外一个是平均池化(MeanPooling)。如图2-4所示,池化过程是将输入图像平均划分成若干个矩形区域,最大的池化则是将池化区域的像素点取最大值,这种方式得到的特征图对纹理特征信息更加敏感;平均池化则是对池化区域内的图像取平均值,这种方式得到的特征信息对背景信息更加敏感,例如可以帮助分类。这种机制能够有效的原因在于,在发现一个特征之后,它的精确位置远不及它和其他特征的相对位置的关系重要。对卷积神经网络进行池化处理可以降低卷积操作输出特征图的大小。首先,池化层缩小了卷积神经网络的规模,能够使卷积神经网络训练的权重数量得到明显下降。除此之外,池化层能够实现感受野的范围的增加。同时,池化层还能够在一定程度上克服过拟合的现象。池化层也有平移、缩放和旋转不变性等特点。池化层只能减小特征图的维度,但是不会改变特征图的数量。池化层不会增加训练的权重数量。在池化操作的过程中,还使用改变步长大小的方法来控制输出特征图的维度。
文章图片
一般来说,当需要综合特征图上的所有信息做相应决策时,通常会用AvgPooling,例如在图像分割领域中用Global AvgPooling来获取全局上下文信息;在图像分类中在最后几层中会使用AvgPooling。因为网络深层的高级语义信息可以帮助分类器分类。在图像分割/目标检测/图像分类前面几层,由于图像包含较多的噪声和目标处理无关的信息,因此在前几层会使用MaxPooling去除无效信息。
推荐阅读
- 目标检测|yolov5——detect.py代码【注释、详解、使用教程】
- 激光条纹中心提取|激光条纹中心提取——灰度重心法
- 业界观点|深度学习崛起十年(“开挂”的OpenAI革新者)
- 计算机视觉|斯坦福大学计算机视觉课程cs231n——第一课(课程介绍 计算机视觉概述)
- 深度学习|基于Pytorch的神经网络之Optimizer
- keras|OpenCV-Python实战(22)——使用Keras和Flask在Web端部署图像识别应用
- yolo|YOLO V5解读
- yolo|YOLO V4详解
- 大数据|关于Vision Transformer的一些思考