神经网络：非线性激活（ReLU & Sigmoid）详解

本文通过PyTorch实战演示了ReLU和Sigmoid两种激活函数的应用。实验使用CIFAR-10数据集，结合Tensorboard可视化，展示非线性激活对神经网络的重要性。ReLU通过截断负值筛选特征，计算高效；Sigmoid将数值压缩到(0,1)区间，适合分类输出。代码实现了一个串联网络：先用ReLU过滤输入，再通过Sigmoid映射。实验显示激活函数会显著改变图像特征，ReLU消除负值，S

夜瞬

583人浏览 · 2026-01-15 22:13:04

夜瞬 · 2026-01-15 22:13:04 发布

本文通过 PyTorch 实战演示了 ReLU 和 Sigmoid 两种核心非线性激活函数的使用。通过对 CIFAR-10 数据集进行处理并结合 Tensorboard 可视化，深入浅出地解释了为什么非线性激活是神经网络具备强大拟合能力的关键，适合深度学习初学者快速上手。

1. 为什么需要非线性激活？

如果在神经网络中不使用非线性激活函数，无论你的网络有多少层，最终都只是输入的线性组合（相当于一层感知机）。

非线性激活的作用：

引入非线性特征：使模型能够拟合复杂的函数关系（如曲线、边界等）。
特征提取：通过截断或压缩数据，帮助网络学习更有用的信号。

2. 常用激活函数对比

在你的代码中，同时使用了最经典的两种激活函数：

ReLU (Rectified Linear Unit)

公式：
特点：输入大于 0 时原样输出，小于 0 时变为 0。
优点：计算速度极快，有效缓解梯度消失问题，是目前卷积神经网络的首选。

Sigmoid

公式:
特点：将输入数值压缩到 (0, 1)之间。
优点：适合做二分类输出；缺点：在深层网络中容易导致梯度消失，且计算量相对较大。

3. 代码逻辑解析

在本次实验中，我们定义了一个串联的激活网络：输入先经过 ReLU 过滤负数，再经过 Sigmoid 进行归一化映射。

class Relu1(nn.Module):
    def __init__(self):
        super(Relu1, self).__init__()
        self.relu = ReLU()        # 实例化 ReLU
        self.sigmoid = Sigmoid()  # 实例化 Sigmoid

    def forward(self, x):
        out1 = self.relu(x)       # 第一步：把小于0的数变0
        out2 = self.sigmoid(out1) # 第二步：把数值映射到 0~1 之间
        return out2

矩阵计算演示

以代码中的 input_x 为例：

输入：[[1, 0.5], [-1, 3]]
经过 ReLU：[[1, 0.5], [0, 3]] （-1 被截断为 0）
经过 Sigmoid：每个元素计算，最终结果均在 0.5 到 1 之间。

4. 实战与可视化

通过 CIFAR-10 数据集，我们可以直观看到激活函数对图像的影响。

运行步骤：

运行 Python 脚本生成日志。
在终端输入：tensorboard --logdir=Relu。
打开浏览器查看图像。

实验现象观察：

输入图像：正常的 RGB 彩色图片。
输出图像：经过 ReLU 和 Sigmoid 后，图像色调会发生明显变化。因为 ReLU 抹去了部分负值特征（虽然图像像素通常为正，但在某些标准化处理后会有负值），而 Sigmoid 将像素值重新压缩，导致对比度改变。

5. 总结

ReLU 是“过滤器”，负责筛选重要特征。
Sigmoid 是“压缩器”，负责控制数值范围。
在实际开发中，通常在隐藏层使用 ReLU，在二分类任务的输出层使用 Sigmoid。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git