第三章--卷积神经网络(下)
本文继续讲解卷积神经网络的关键操作:填充通过在特征图外围补零来保持矩阵尺寸稳定;给出特征图尺寸计算公式;介绍池化操作(平均池化和最大池化)的原理与作用;阐述多通道运算规则,指出卷积核数量需与通道数一致,最终通过叠加生成特征矩阵。这些操作为后续激活函数分类和回归奠定基础,完成卷积神经网络的核心流程介绍。
在上一章中,我们介绍了卷积神经网络的图像识别原理,通道构成和计算方式,这一张我们接着上一讲的内容,继续讲解相关知识:填充,特征图计算公式,池化和多通道运算。
填充操作
在介绍填充操作之前,我们先回顾一下上一章最后的内容:步幅。步幅是卷积核在特征图中的移动“速度”。那么,在多次卷积运算过后,我们的特征图会变得越来越小,直至“消失”。那么,如果最后的结果是一个n*1*1的矩阵的话,我们所做的运算就没有任何意义了,于是,我们需要一种操作来使矩阵在每次运算过后保持原有的大小,以控制图的形状——那么,填充的方法应运而生:


如图,假设这是一个经过一次卷积运算过后的矩阵我们为了维持一个范围内稳定的矩阵大小,我们常常采用在这一矩阵外围一圈填充‘0’的方法(‘0’的厚度与卷积核-1的厚度对冲来尽量维持厚度)。这样,在下一次卷积运算中,我们的矩阵就可以稳定在一个范围内稳定大小:

特征图计算
相关特征图的计算,我们可以使用以下的公式:

其中,OH代表输出的特征图高度,P是填充的单边厚度,H是输入特征图高度,FH是卷积核的高度。同理,OW则是输出特征图宽度,以此类推,可以算出宽度方向的数据。

池化层操作
池化是卷积神经中的精髓,我们在这里仅介绍两种经典池化操作——平均池化和最大池化。在正式开始之前,我们先介绍一下感受野的概念:感受野是矩阵中某一子矩阵的称呼,它的计算类似卷积核,只不过FH和FW分别为感受野的长和宽。如图:

平均池化:
感受野中的数字求和(∑)再均摊求平均值并放入对应的矩阵答案里。

最大池化:
取感受野中最大的一个数字(MAX)并放入对应的矩阵答案里。
在池化的过程中,我们的目的是缩小矩阵,获取最有代表性的特征值并把他们放在一个新的矩阵里面,在这个过程中我们会特化一些重要参数,并且会损失一些边缘参数。
多通道运算
对于多通道运算,我们需要记住一个性质:卷积核的个数和通道数相等。一堆特征图和其对应的卷积核进行相乘再相加的运算过后,再把多层特征图对应叠加为新的特征矩阵。

在正式的计算中,我们的多通道用C表示。
这里的多个卷积核代表着不同权重,最后叠加出的图层再次叠加,最后呈现一个特征矩阵。矩阵运算之后我们下一步就是分类和回归了,这个时候就要引入我们第一章讲的激活函数,进行下一步的拟合训练。

到此,卷积神经网络介绍完毕~
更多推荐
所有评论(0)