第三章--卷积神经网络（下）

本文继续讲解卷积神经网络的关键操作：填充通过在特征图外围补零来保持矩阵尺寸稳定；给出特征图尺寸计算公式；介绍池化操作（平均池化和最大池化）的原理与作用；阐述多通道运算规则，指出卷积核数量需与通道数一致，最终通过叠加生成特征矩阵。这些操作为后续激活函数分类和回归奠定基础，完成卷积神经网络的核心流程介绍。

水木兰亭

696人浏览 · 2025-11-27 20:41:04

水木兰亭 · 2025-11-27 20:41:04 发布

在上一章中，我们介绍了卷积神经网络的图像识别原理，通道构成和计算方式，这一张我们接着上一讲的内容，继续讲解相关知识：填充，特征图计算公式，池化和多通道运算。

填充操作

在介绍填充操作之前，我们先回顾一下上一章最后的内容：步幅。步幅是卷积核在特征图中的移动“速度”。那么，在多次卷积运算过后，我们的特征图会变得越来越小，直至“消失”。那么，如果最后的结果是一个n*1*1的矩阵的话，我们所做的运算就没有任何意义了，于是，我们需要一种操作来使矩阵在每次运算过后保持原有的大小，以控制图的形状——那么，填充的方法应运而生：

如图，假设这是一个经过一次卷积运算过后的矩阵我们为了维持一个范围内稳定的矩阵大小，我们常常采用在这一矩阵外围一圈填充‘0’的方法（‘0’的厚度与卷积核-1的厚度对冲来尽量维持厚度）。这样，在下一次卷积运算中，我们的矩阵就可以稳定在一个范围内稳定大小：

特征图计算

相关特征图的计算，我们可以使用以下的公式：

其中，OH代表输出的特征图高度，P是填充的单边厚度，H是输入特征图高度，FH是卷积核的高度。同理，OW则是输出特征图宽度，以此类推，可以算出宽度方向的数据。

池化层操作

池化是卷积神经中的精髓，我们在这里仅介绍两种经典池化操作——平均池化和最大池化。在正式开始之前，我们先介绍一下感受野的概念：感受野是矩阵中某一子矩阵的称呼，它的计算类似卷积核，只不过FH和FW分别为感受野的长和宽。如图：

平均池化：

感受野中的数字求和(∑)再均摊求平均值并放入对应的矩阵答案里。

最大池化：

取感受野中最大的一个数字(MAX)并放入对应的矩阵答案里。

在池化的过程中，我们的目的是缩小矩阵，获取最有代表性的特征值并把他们放在一个新的矩阵里面，在这个过程中我们会特化一些重要参数，并且会损失一些边缘参数。

多通道运算

对于多通道运算，我们需要记住一个性质：卷积核的个数和通道数相等。一堆特征图和其对应的卷积核进行相乘再相加的运算过后，再把多层特征图对应叠加为新的特征矩阵。

在正式的计算中，我们的多通道用C表示。

这里的多个卷积核代表着不同权重，最后叠加出的图层再次叠加，最后呈现一个特征矩阵。矩阵运算之后我们下一步就是分类和回归了，这个时候就要引入我们第一章讲的激活函数，进行下一步的拟合训练。

到此，卷积神经网络介绍完毕~

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git