七、深度学习——RNN

输出结果：主要包括输出结果output，最后一层的hn。输入数据：输入主要包括词嵌入的x，初始的隐藏层h0。实际上，字是重复输入到同一个神经元中的。

TY-2025

550人浏览 · 2025-07-14 22:27:21

TY-2025 · 2025-07-14 22:27:21 发布

一、RNN网络原理

文本数据是具有序列特性的。为了表示出数据的序列关系，需要使用循环神经网络（Recurrent Nearal Networks,RNN）来对数据进行建模，RNN是一个作用于处理带有序列特点的样本数据

1.RNN的计算过程

h表示隐藏状态，每一次的输入都会包含两个值：上一个时间步的隐藏状态，当前状态的输入值，输出当前时间步的隐藏状态和当前时间步的预测结果

实际上，字是重复输入到同一个神经元中的

2.神经元内部的计算过程

$h_t= tanh(W_{ih}x_t+b_{ih}+W_{hh}h_{t-1}+b_{hh})$

$W_{ih}$ 表示输入数据的权重
$b_{ih}$ 表示输入数据的偏置
$W_{hh}$ 表示输入隐藏状态的权重
$b_{hh}$ 表示输入隐藏状态的偏置
最后对输出结果使用tanh激活函数进行计算，得到该神经元的输出

3.API

RNN = torch.nn.RNN(input_size, hidden_size, num_layer)

input_size：输入数据的维度，一般设为词向量的维度
hidden_size：隐藏层h的维数，也是当前层神经元的输出维度
num_layer：隐藏层h的层数，默认为1

将RNN实例化就可以将数据送入进行处理，处理方式如下：

output, hn = RNN(x, h0)

输入数据：输入主要包括词嵌入的x，初始的隐藏层h0
- x的表示形式为[seq_len, batch, input_size]，即[句子的长度，batch的大小，词向量的维度]
- h0的表示形式为[num_layers, batch, hidden_size]，即[隐藏层的层数, batch的大小,隐藏层h的维数]（初始化设置为全0）
输出结果：主要包括输出结果output，最后一层的hn
- output的表示形式为[seq_len, batch, input_size]，即[句子的长度，batch的大小，词向量的维度]
- hn的表示形式为[num_layers, batch, hidden_size]，即[隐藏层的层数, batch的大小,隐藏层h的维数]

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git