第1章 PyTorch和神经网：1.1 PyTorch和神经网络

第1章 PyTorch和神经网络1.1 PyTorch入门1.1.2 PyTorch张量1.1.3 PyTorch的自动求导机制1.1.4 计算图自动梯度计算看似很神奇，但它其实并不是魔术。它背后的原理很值得深入了解，这些知识将帮助我们构建更大规模的网络。看看下面这个非常简单的网络。它甚至不算一个神经网络，而只是一系列计算。在上图中，我们看到输入x被用于计算y，y再被用于计算输出z。假设y和z的计

sunshinecxm_BJTU

1334人浏览 · 2022-04-22 17:52:12

sunshinecxm_BJTU · 2022-04-22 17:52:12 发布

第1章 PyTorch和神经网络

1.1 PyTorch入门

1.1.2 PyTorch张量

1.1.3 PyTorch的自动求导机制

1.1.4 计算图

自动梯度计算看似很神奇，但它其实并不是魔术。
它背后的原理很值得深入了解，这些知识将帮助我们构建更大规模的网络。
看看下面这个非常简单的网络。它甚至不算一个神经网络，而只是一系列计算。
在这里插入图片描述
在上图中，我们看到输入x被用于计算y，y再被用于计算输出z。
假设y和z的计算过程如下：

如果我们希望知道输出 $z$ 如何随 $x$ 变化，我们需要知道梯度 $d y / d x$ 。下面我们来逐步计算。

第一行是微积分的链式法则（chain rule），对我们非常重要。
我们刚刚算出， $z$ 随 $x$ 的变化可表示为 $4 x$ 。如果 $x = 3.5$ ，则 $d z / d x = 4 \times 3.5 = 14$ 。

当 $y$ 以 $x$ 的形式定义，而 $z$ 以 $y$ 的形式定义时，PyTorch便将这些张量连成一幅图，以展示这些张量是如何连接的。这幅图叫计算图（computation graph）。

在我们的例子中，计算图看起来可能是下面这样的：
在这里插入图片描述
我们可以看到 $y$ 是如何从 $x$ 计算得到的， $z$ 是如何从 $y$ 计算得到的。此外，PyTorch还增加了几个反向箭头，表示 $y$ 如何随着 $x$ 变化， $z$ 如何随着 $y$ 变化。这些就是梯度，在训练过程中用来更新神经网络。微积分的过程由PyTorch完成，无须我们自己动手计算。

为了计算出 $z$ 如何随着 $x$ 变化，我们合并从 $z$ 经由 $y$ 回到 $x$ 的路径中的所有梯度。这便是微积分的链式法则。
在这里插入图片描述
PyTorch先构建一个只有正向连接的计算图。我们需要通过backward()函数，使PyTorch计算出反向的梯度。

梯度dz/dx在张量x中被存储为x.grad。

值得注意的是，张量 $x$ 内部的梯度值与z的变化有关。这是因为我们要求PyTorch使用z.backward ()从 $z$ 反向计算。因此， $x . g r a d$ 是 $d z / d x$ ，而不是 $d y / d x$ 。

大多数有效的神经网络包含多个节点，每个节点有多个连进该节点的链接，以及从该节点出发的链接。让我们来看一个简单的例子，例子中的节点有多个进入的链接。
在这里插入图片描述
可见，输入 $a$ 和 $b$ 同时对 $x$ 和 $y$ 有影响，而输出 $z$ 是由 $x$ 和 $y$ 计算出来的。
这些节点之间的关系如下。

我们按同样的方法计算梯度。

接着，把这些信息添加到计算图中。

现在，我们可以轻易地通过z到a的路径计算出梯度dz/da。实际上，从z到a有两条路径，一条通过x，另一条通过y，我们只需要把两条路径的表达式相加即可。这么做是合理的，因为从a到z的两条路径都影响了z的值，这也与我们用微积分的链式法则计算出的dz/da的结果一致。

$d z / d a = d z / d x + d x / d a + d z / d y + d y / d a$
在这里插入图片描述
第一条路径经过 $x$ ，表示为 $2 \times 2$ ；第二条路径经过 $y$ ，表示为 $3 \times 10 a$ 。所以， $z$ 随 $a$ 变化的速率是 $4 + 30 a$ 。
如果 $a$ 是2，则 $d z / d a$ 是4 + 30 × 2 = 64。

我们来检验一下用PyTorch是否也能得出这个值。首先，我们定义PyTorch构建计算图所需要的关系。

在这里插入图片描述
接着，我们触发梯度计算并查询张量 $a$ 里面的值。

有效的神经网络通常比这个小型网络规模大得多。但是PyTorch构建计算图的方式以及沿着路径向后计算梯度的过程是一样的。

1.1.5 学习要点

Colab服务允许我们在谷歌的服务器上运行Python代码。Colab使用Python笔记本，我们只需要一个Web浏览器即可使用。
PyTorch是一个领先的Python机器学习架构。它与numpy类似，允许我们使用数字数组。同时，它也提供了丰富的工具集和函数，使机器学习更容易上手。
在PyTorch中，数据的基本单位是张量（tensor）。张量可以是多维数组、简单的二维矩阵、一维列表，也可以是单值。
PyTorch的主要特性是能够自动计算函数的梯度（gradient）。梯度的计算是训练神经网络的关键。为此，PyTorch需要构建一张计算图（computationgraph），图中包含多个张量以及它们之间的关系。在代码中，该过程在我们以一个张量定义另一个张量时自动完成。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git