卷积操作是如何在RGB三通道上操作的

大家的印象中卷积的计算过程是不是如下图?
卷积操作是如何在RGB三通道上操作的
文章图片
image 而实际上,这只是一种你说的channel等于1的灰度图输入的情况。
一般情况下的计算过程是这样的:
卷积操作是如何在RGB三通道上操作的
文章图片
image 左列的X是输入的图像(此处channel是3,也可理解为RGB即你说的彩色图像),中间红色的两列是我们的kernel(即33的filter),共两个(即输出的feature通道为2)。最后一列为卷积之后的特征(由于2个kernel,输出通道为2)。
那么,由上面的过程可以看出,输入是3维(hight
widthchannel)的,kernel实际也是三维*的。卷积网络的特征变化可以用下图表示:
卷积操作是如何在RGB三通道上操作的
文章图片
image 题主说的灰度图,只是在输入的时候channel等于1的情况而已,中间也会被N个kernel扩展为N个channel。

【卷积操作是如何在RGB三通道上操作的】(图片2.3来源于斯坦福大学神经网络课程)

    推荐阅读