头歌——机器、深度学习——RNN和LSTM

本关任务：通过学习循环神经网络的相关知识，完成单向循环网络的编写。对于我们已经学过的传统神经网络，它们能够实现分类以及标注任务，但一旦处理具有前后遗存关系的数据时，效果就不是十分理想了。这个问题主要由于传统神经网络的结构所导致。这时我们就需要一个不仅仅只依赖当前的输入，还需要结合前一时刻或后一时刻的输入作为参考。循环神经网络就是根据这样的需求而设计的。循环神经网络的主要用途是处理和预测序列数据。循

absths

1636人浏览 · 2024-06-13 16:21:33

absths · 2024-06-13 16:21:33 发布

第1关：循环神经网络简介

任务描述

本关任务：通过学习循环神经网络的相关知识，完成单向循环网络的编写。

编程要求

根据提示，在右侧编辑器 Begin-End 区间补充代码，完善循环神经网络的网络模型。

测试说明

平台会对你编写的代码进行测试：

测试输入：无预期输出： init success! rnn success!

提示：

循环神经网络的初始状态全部为零；
隐藏层的结果需要经过激活后再传入输出层，本次实训采用tanh函数作为激活函数，可以使用torch.tanh()函数；
矩阵相乘可以使用torch.matmul(a,b)函数。

开始你的任务吧，祝你成功！

第1关任务代码

import torch
    
    
def rnn(input,state,params):
    """
    循环神经网络的前向传播
    :param input: 输入，形状为 [ batch_size,num_inputs ]
    :param state: 上一时刻循环神经网络的状态，形状为 [ batch_size,num_hiddens ]
    :param params: 循环神经网络的所使用的权重以及偏置
    :return: 输出结果和此时刻网络的状态
    """
    W_xh,W_hh,b_h,W_hq,b_q = params
    """
    W_xh : 输入层到隐藏层的权重
    W_hh : 上一时刻状态隐藏层到当前时刻的权重
    b_h : 隐藏层偏置
    W_hq : 隐藏层到输出层的权重
    b_q : 输出层偏置
    """
    H = state
    ########## Begin ##########
    # 输入层到隐藏层
    H = torch.matmul(input, W_xh) + torch.matmul(H, W_hh) + b_h
    H = torch.tanh(H)
    # 隐藏层到输出层
    Y = torch.matmul(H, W_hq) + b_q
    ########## End ##########
    return Y,H
def init_rnn_state(num_inputs,num_hiddens):
    """
    循环神经网络的初始状态的初始化
    :param num_inputs: 输入层中神经元的个数
    :param num_hiddens: 隐藏层中神经元的个数
    :return: 循环神经网络初始状态
    """
    ########## Begin ##########
    init_state = torch.zeros((num_inputs,num_hiddens),dtype=torch.float32)
    ########## End ##########
    return init_state

第2关：循环神经网络简介

任务描述

本关任务：通过学习长短时记忆网络相关知识，编写实现长短时记忆网络。

编程要求

根据提示，在右侧编辑器 Begin-End 区间补充代码，编写实现 LSTM 的遗忘门、输入门、输出门。

测试说明

平台会对你编写的代码进行测试：

测试输入：无预期输出： True

开始你的任务吧，祝你成功！

第2关任务代码

import torch
 
def lstm(X,state,params):
    """
    LSTM
    :param X: 输入
    :param state: 上一时刻的单元状态和输出
    :param params: LSTM 中所有的权值矩阵以及偏置
    :return: 当前时刻的单元状态和输出
    """
    W_xi, W_hi, b_i, W_xf, W_hf, b_f, W_xo, W_ho, b_o, W_xc, W_hc, b_c, W_hq, b_q = params
    """
    W_xi,W_hi,b_i : 输入门中计算i的权值矩阵和偏置
    W_xf,W_hf,b_f : 遗忘门的权值矩阵和偏置
    W_xo,W_ho,b_o : 输出门的权值矩阵和偏置
    W_xc,W_hc,b_c : 输入门中计算c_tilde的权值矩阵和偏置
    W_hq,b_q : 输出层的权值矩阵和偏置
    """
    #上一时刻的输出 H 和 单元状态 C。
    (H,C) = state
    ########## Begin ##########
    # 遗忘门
    F = torch.matmul(X, W_xf) + torch.matmul(H, W_hf) + b_f
    F = torch.sigmoid(F)
    # 输入门
    I = torch.sigmoid(torch.matmul(X,W_xi)+torch.matmul(H,W_hi) + b_i)
    C_tilde = torch.tanh(torch.matmul(X, W_xc) + torch.matmul(H, W_hc) + b_c)
    C = F * C + I * C_tilde
    # 输出门
    O = torch.sigmoid(torch.matmul(X,W_xo)+torch.matmul(H,W_ho) + b_o)
    H = O * C.tanh()
    # 输出层
    Y = torch.matmul(H,W_hq) + b_q
    ########## End ##########
    return Y,(H,C)