yolov4网络结构_目标检测YOLO V4 yolov4网络结构

一、YOLO-v4主要做了什么？
通俗的讲，就是说这个YOLO-v4算法是在原有YOLO目标检测架构的基础上，采用了近些年CNN领域中最优秀的优化策略，从数据处理、主干网络、网络训练、激活函数、损失函数等各个方面都有着不同程度的优化，虽没有理论上的创新，但是会受到许许多多的工程师的欢迎，各种优化算法的尝试。文章如同于目标检测的trick综述，效果达到了实现FPS与Precision平衡的目标检测 new baseline。
①论文主要有以下三点贡献：

开发了一个高效而强大的模型，使得任何人都可以使用一张1080Ti或者2080Ti GPU去训练一个超级快速和精确的目标检测器。
验证了一系列state-of-the-art的目标检测器训练方法的影响。
修改了state-of-the-art方法，使得他们在使用单个GPU进行训练时更加有效和适配，包括CBN，PAN，SAM等。

②作者把训练的方法分成了两类：

Bag of freebies：只改变训练策略或者只增加训练成本，比如数据增强。
Bag of specials：插件模块和后处理方法，它们仅仅增加一点推理成本，但是可以极大地提升目标检测的精度。

二、网络结构

上图总结了近些年的目标检测检测器的优化改进手段的方向结构组成，同时在下面对几个重要改进的部分列出了改进的方法，如下：[3]

文章图片

目前主流two-stage检测器的主要架构

Input部分：Image，Patches，Images Pyramid(图像金字塔)
Backbone部分：VGG16，ResNet-50，SpineNet，EfficientNet-B0 / B7，CSPResNeXt50，CSPDarknet53
neck部分：
- Additional blocks：SPP，ASPP，RFB，SAM
- Path-aggregation blocks：FPN，PAN，NAS-FPN，Fully-connected FPN，BiFPN，ASFF，SFAM
Heads部分：
- Faster R-CNN，R-FCN，Mask R-CNN(基于anchor)
- RepPoints(无anchor)
- RPN，SSD，YOLO，RetinaNet (基于anchor)
- CornerNet，CenterNet，MatrixNet，FCOS(无anchor)
- Dense Predictions(one-stage)：
- Sparse Predictions(two-stages)：

2. 下图为 yolov4 网络结构的采用的算法，其中保留了yolov3的head部分，修改了主干网络为CSPDarknet53，同时采用了SPP(空间金字塔池化)的思想来扩大感受野，PANet作为neck部分。

文章图片

Yolo-v4网络架构图
3. 下图为yolov4在技术处理的思维导图：

文章图片

YOLO-v4的backbone与detector的主要技术实现
三、算法知识点相关释义

BoF(bag of freebies)

在文中是指那些能够提高精度而不增加推断时间的技术。

比如数据增广的方法：图像几何变换、Cutout、grid mask等，
网络正则化的方法：Dropout、Dropblock等，
类别不平衡的处理方法，
难例挖掘方法，
损失函数的设计等，

2. BoS(bag of specials)
是指那些增加稍许推断代价，但可以提高模型精度的方法。

比如增大模型感受野的SPP、ASPP、RFB等，
引入注意力机制Squeeze-and-Excitation (SE) 、Spatial Attention Module (SAM)等，
特征集成方法SFAM , ASFF , BiFPN等，
改进的激活函数Swish、Mish等，
或者是后处理方法如soft NMS、DIoU NMS等，

３.在目标检测训练中，通常对CNN的优化改进方法：

激活函数：ReLU，leaky-ReLU，parameter-ReLU，ReLU6，SELU，Swish或Mish
bbox回归loss函数：MSE，IoU，GIoU，CIoU，DIoU
数据增强：CutOut，MixUp，CutMix
正则化方法：DropOut，DropPath，Spatial DropOut或DropBlock
通过均值和方差对网络激活进行归一化：Batch Normalization (BN), Cross-GPU Batch Normalization (CGBN or SyncBN), Filter Response Normalization (FRN), orCross-Iteration Batch Normalization (CBN)
跨连接：Residual connections, Weightedresidual connections, Multi-input weighted residualconnections, or Cross stage partial connections (CSP)