【前馈神经网络详解与实例】1——网络结构

前馈神经网络是一种单向信息流动的人工神经网络，由输入层、隐藏层和输出层组成，是最基础的深度学习模型。其核心结构包括神经元（M-P模型）、感知机（单层线性分类器）和多层感知机（MLP）。MLP通过全连接层进行线性变换，配合激活函数引入非线性，从而能够拟合复杂函数关系。全连接层的参数包括权值矩阵和偏置项，通过多层非线性变换实现从数据到目标的端到端学习。这种结构使神经网络具备强大的特征提取和模式识别能力

colus_SEU

1101人浏览 · 2025-08-19 21:19:00

colus_SEU · 2025-08-19 21:19:00 发布

前馈神经网络的定义：前馈神经网络是一种最简单的人工神经网络，其信息流动方向是单向的（从输入层→隐藏层→输出层），不存在循环或反馈连接，是深度学习的基础模型。
前馈神经网络的核心思想：通过多层非线性变换拟合输入与输出之间的映射关系，实现从数据到目标的端到端学习。

我的前馈神经网络系列文章如下，便于读者成体系学习：

【前馈神经网络详解与实例】1——网络结构-CSDN博客

【前馈神经网络详解与实例】2——激活函数-CSDN博客

【前馈神经网络详解与实例】3——初始化方法-CSDN博客

【前馈神经网络详解与实例】4——损失函数-CSDN博客

【前馈神经网络详解与实例】5——参数优化方法-CSDN博客

【前馈神经网络详解与实例】6——正则化方法-CSDN博客

【前馈神经网络详解与实例】7——典型网络介绍-CSDN博客

【前馈神经网络详解与实例】8——实战应用-CSDN博客

1、🕸 网络结构

1.1神经元

受生物神经元的启发，人工神经元接收来自其他神经元或外部源的输入，每个输入都有一个相关的权值，它是根据该输入对当前神经元的重要性来确定的，对该输入加权并与其他输入求和后，经过一个激活函数，计算得到该神经元的输出。也可以说，一个神经元的功能是求得输入向量与权向量的内积后，经一个非线性传递函数（激活函数）得到一个标量结果。一个简单的神经元结构如下图所示：

$x_1,...,x_n$ 为输入

$b$ 为偏置项

$w_1,...,w_n$ 为输入对应的权值

$b+\sum_{i=1}^{n}x_iw_i$ 即为对输入加权并与其他输入求和

$f$ 为激活函数

1943 年，McCulloch 和 Pitts 将上述情形抽象为上图所示的简单模型，这就是一直沿用至今的 M-P 神经元模型。把许多这样的神经元按照一定的层次结构连接起来，就得到了神经网络。

1.2 感知机与多层感知机（MLP）

1.2.1 感知机、多层感知机的概念

感知机（PLA，Perceptron Learning Algorithm）：

感知机由两层神经网络组成，输入层接收外界输入信号后传递给输出层，输出层是 M-P 神经元，这两层共同组成了一个简单的神经元，即单个神经元模型，是较大神经网络的前身。它是一个线性的二分类器，但它对非线性的数据并不能进行有效的分类。因此我们可以加深这个神经元的网络层次，理论上来说，多层网络可以模拟任何复杂的函数。以下是感知机的概念公式：

$u=b+\sum_{i=1}^{n}x_iw_i \\ y=f(u)$

其中 $f$ 为激活函数

多层感知机（MLP，Multi-Layer Perceptron）：

概念：由感知机推广而来，它最主要的特点就是有多个神经元层，因此 MLP 也被称为人工神经网络（Artificial Neural Network，ANN）。MLP 是一种特定类型的人工神经网络，它由多个神经元组成，通常包括一个输入层、一个或多个隐藏层以及一个输出层。相对而言，ANN 是一个更广泛的术语，它包括了所有由神经元组成的网络，而 MLP 则是 ANN 中的一个特例，指代具有多个层的前馈神经网络。所以在讨论上，MLP 和 ANN 可以互换使用。

全连接层：从结构图中我们可以看出，多层感知机这三类给定层（输入、中间、输出层）中的每个节点都会连接到相邻层中的每个节点（全连接），所以这里有一个MLP中最重要的一个组成就是Dense Layer（全连接层/线性层/稠密层，在本文中我称之为全连接层）,它在MLP中发挥的是什么样的作用呢？全连接层中有一个可以学习的参数 W（ $m \times n$ 维矩阵，n：输入特征的维度，m：输出的向量的长度），还有一个参数 b（偏置项，长为 m），所以在这一层我们会对输入的数据 x 进行下面的公式计算，得到输出 y 。

$y_i=\sum_{j=1}^{n} W_{ij}x_i + b_i,i=1,...,m$

写成向量形式：

$y=Wx+b$

那么之前我们所了解到的线性回归，本质上就可以认为是一个全连接层，但是只有一个输出，即 $m=1$
非线性结构的由来：如何将线性结构变为多层感知机呢？——重点就是：全连接（Dense） + 激活函数（引入非线性）。将全连接层简单的叠加在一起还是线性的，所以要加入非线性的东西在里面，也就是激活函数（比如sigmoid、Relu等），才能实现非线性（可以去拟合各种各样的函数，更具现实意义）。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git