高瀛率

在卷积网络结构中,提升网络性能最直接的方法就是提升网络的深度和宽度,但是,网络结构深度和宽度的提升也将带来一些问题:
高瀛率
文章图片





(1)参数太多,如果训练数据集有限,很容易产生过拟合;
(2)网络越大、参数越多,计算复杂度越大,难以应用;
(3)网络越深,容易出现梯度弥散问题(梯度越往后穿越容易消失),难以优化模型。
解决这些问题的方法当然就是在增加网络深度和宽度的同时减少参数,为了减少参数,自然就想到将全连接变成稀疏连接。但是在实现上,全连接变成稀疏连接后实际计算量并不会有质的提升,因为大部分硬件是针对密集矩阵计算优化的,稀疏矩阵虽然数据量少,但是计算所消耗的时间却很难减少。
那么,有没有一种方法既能保持网络结构的稀疏性,又能利用密集矩阵的高计算性能。大量的文献表明可以将稀疏矩阵聚类为较为密集的子矩阵来提高计算性能,就如人类的大脑是可以看做是神经元的重复堆积,因此,GoogLeNet团队提出了Inception网络结构,就是构造一种“基础神经元”结构,来搭建一个稀疏性、高计算性能的网络结构。如下图所示就是最原始的Inception网络结构:
【高瀛率】
高瀛率
文章图片


这种网络结构对同一特征图使用不同的尺寸的卷积核进行卷积和池化操作(在卷积和池化过程中,通过调节padding和步长是的所有卷积核池化操作输出尺寸一致),然后对所有操作输出的特征图在进行一次堆叠作为Inception网络的输出。然而,这种结构却仍然不够理想,因为计算量的问题依然没有得到很好的改善。

回到顶部
2.2 1*1的卷积核?
对于Inception没有显著降低计算量的问题,Google团队的做法是在33和55的卷积操作前,先对特征图进行一次11卷积操作。
1
1的卷积实际上是对特征图中不同通道上相同位置的像素值惊喜线性组合,且保留了图片的原有平面结果,调整通道熟练IG,从而实现降维或升维的功能。
下左图显示了1×1卷积核用于降维。输入为4×4的平面,共3个通道。用两个1×1的卷积核(卷积层)作用之后,变为4×4的平面,共2通道。同理,下右图展示了升维的操作。

高瀛率
文章图片


添加1*1卷积后,Inception网络结构如下图所示:

高瀛率
文章图片


为什么在33和55卷积前添加一层11卷积能达到降低计算量的作用呢?
以5
5卷积为例,假设对100 100 128的特征图进行卷积,使用256个5 5卷积核进行卷积操作,参数量为(128 5 5+1)256=819456,如果在进行55卷积之前,使用32个11卷积核进行卷积,得到将是32 100 100的,然后在使用256个5 5的卷积核进行卷积,参数量为(128 1 1+1) 32+(32 5 5+1) * 256=209184。可见,参数量大大减少。

Inception V1 参数少但是效果好的原因除了模型层数更深,表达能力更强外,还有两点:一是去除最后的全连接层,用全局平均池化层(即将图片尺寸变为1*1)来取代它。全连接层几乎占据了 AlexNet 或者 VGGNet中90%的参数量,而且会引起过拟合,去除全连接层后模型训练更快并且减轻了过拟合。二是 Inception V1中精心设计的 Inception 网络结构 提高了参数的利用效率。GoogLeNet完整结构(22层)如下图所示。



    推荐阅读