卷积神经网络的权值参数个数的量化分析

考虑 103×10310^3\times 10^3 的输入图像：全连接，隐层神经元的数目为 10610^6 时，则每一个输入像素与每一个隐层神经元之间都是待学习的参数，数目为 106×106=101210^6\times 10^6=10^{12}卷积，卷积核的大小为 10×1010\times 10 时，步长为 10，103×10310×10×(10×10)\frac{10^3\time

五道口纳什

6182人浏览 · 2017-05-14 10:32:23

五道口纳什 · 2017-05-14 10:32:23 发布

考虑 103×103<script type="math/tex" id="MathJax-Element-1">10^3\times 10^3</script> 的输入图像：

全连接，隐层神经元的数目为 106<script type="math/tex" id="MathJax-Element-2">10^6</script> 时，则每一个输入像素与每一个隐层神经元之间都是待学习的参数，
- 数目为 106×106=1012<script type="math/tex" id="MathJax-Element-3">10^6\times 10^6=10^{12}</script>
卷积，卷积核的大小为 10×10<script type="math/tex" id="MathJax-Element-4">10\times 10</script> 时，
- 步长为 10，103×10310×10×(10×10)<script type="math/tex" id="MathJax-Element-5">\frac{10^3\times 10^3}{10\times 10}\times \left(10\times 10\right)</script>，103×10310×10<script type="math/tex" id="MathJax-Element-6">\frac{10^3\times 10^3}{10\times 10}</script>表示的是输入图像可划分的块数，也即经卷机作用后的输出图像；
- 步长为 1，(103−10+1)×(103−10+1)⋅(10×10)<script type="math/tex" id="MathJax-Element-7">\left(10^3-10+1\right)\times\left(10^3-10+1\right)\cdot \left(10\times 10\right)</script>
- 在不考虑步长的前提下，可近似将待学习的参数的数目视为 (103×103)⋅(10×10)<script type="math/tex" id="MathJax-Element-8">\left(10^3\times 10^3\right)\cdot \left(10\times 10\right)</script>

1. 全连接层对参数个数的显著提升

现考虑图像输入层和 500 个隐层神经元的全连接：

MNIST：28×28×1×500=392000<script type="math/tex" id="MathJax-Element-9">28\times 28\times 1\times 500=392000</script>
CIfar：32×32×3×500=1536000<script type="math/tex" id="MathJax-Element-10">32\times 32\times 3\times 500=1536000</script>
- 而对于卷积操作而言，如 5×5<script type="math/tex" id="MathJax-Element-11">5\times 5</script> 深度为 16 的卷积核而言，则需要的计算量为：5×5×3×16+16=1216<script type="math/tex" id="MathJax-Element-12">5\times 5\times 3\times 16+16=1216</script>，极大地降低了参数的规模；

参数增多导致计算速度减慢，且很容易导致过拟合。

2. 卷积的共享参数特性

通过一个某一卷积核（过滤器），将一个 2×2×3<script type="math/tex" id="MathJax-Element-13">2\times 2\times 3</script> 的节点矩阵变化为 1×1×5<script type="math/tex" id="MathJax-Element-14">1\times 1\times 5</script> 的单位节点矩阵，则本次卷积操作，共需要的参数为：

2 \times 2 \times 3 \times 5 + 5 \Rightarrow 65

+5 表示偏值项参数，

对于 cifar-10 数据集，输入层矩阵的维度是 32×32×3<script type="math/tex" id="MathJax-Element-16">32\times 32\times 3</script>，假设第一层卷积层使用尺寸为 5×5<script type="math/tex" id="MathJax-Element-17">5\times 5</script> 深度为 16，则此卷基层的参数为：

5 \times 5 \times 3 \times 16 + \times 16 = 1216

注意区分卷积层的参数，与当前输入层与卷积层的连接的个数（也即参数的个数与连接的数目）：

比如对于 LeNet-5 网络，32×32<script type="math/tex" id="MathJax-Element-301">32\times 32</script> 的输入数据，经过 5×5×1×6<script type="math/tex" id="MathJax-Element-302">5\times 5\times 1\times 6</script> 的卷积，得到 28×28×6<script type="math/tex" id="MathJax-Element-303">28\times 28\times 6</script> 的特征映射：

卷积层的参数：5×5××1×6+6=156<script type="math/tex" id="MathJax-Element-304">5\times 5\times \times 1\times 6+6=156</script>
- 核的长*核的宽*输入的通道数*输出的通道数；
卷积层共 28×28×6=4704<script type="math/tex" id="MathJax-Element-305">28\times 28\times 6=4704</script> 个节点，每个节点和 5×5<script type="math/tex" id="MathJax-Element-306">5\times 5</script> 个当前输入层节点相连，因此共连接数：4704×(5×5+1)=122304<script type="math/tex" id="MathJax-Element-307">4704\times(5\times 5+1)=122304</script>
- 连接的数目与输入层的大小无关；

3. 卷积输出矩阵尺寸的大小

通过使用填充（padding，比如 zero-padding），或者使用过滤器移动的步长来结果输出矩阵的大小。

下面的公式给出在同时使用全零填充时结果矩阵的大小：

o u t l e n g t h = ⌈ i n l e n g t h / s t r i d e l e n g t h ⌉ o u t w i d t h = ⌈ i n l e n g t h / s t r i d e w i d t h ⌉

如果不使用填充：

o u t l e n g t h = ⌈ (i n l e n g t h - f i l t e r l e n g t h + 1) / s t r i d e l e n g t h ⌉ o u t w i d t h = ⌈ (i n l e n g t h - f i l t e r w i d t h + 1) / s t r i d e w i d t h ⌉

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git