【Python TensorFlow】Python BiLSTM双向长短期记忆神经网络时序预测算法（附代码）

摘要：本文提出基于双向长短期记忆网络（BiLSTM）的电力负荷预测方法，通过正反向双通道编码有效捕捉时序特征的长期依赖关系。算法流程包括数据预处理、网络构建（含双向LSTM层）、模型训练（采用MSE损失和Adam优化器）及评估。代码支持多特征输入/多步预测，提供完整数据加载、归一化和三维数据重塑实现，用户只需替换CSV/Excel格式数据集即可运行。实验结果表明该方法能显著提升预测精度，适用于连续

qq_17082750 CNC注塑机数采

426人浏览 · 2025-11-17 21:28:52

qq_17082750 CNC注塑机数采 · 2025-11-17 21:28:52 发布

资源下载：https://download.csdn.net/download/vvoennvv/92334677

一，概述

传统的LSTM在处理电力负荷等多变量时间序列时，往往只能利用过去到现在的单向依赖，容易遗漏序列在不同时间片的双向关联特征，且在较长时间窗口下可能出现信息利用不充分、预测偏差较大等问题。为提升建模对“前后时序相关性”的捕捉能力，并支持多特征输入与多步输出的预测需求，本算法采用双向长短期记忆网络（BiLSTM）结构，对输入窗口中的序列进行正向与反向双通道编码，再通过全连接层输出未来多个时间步的预测结果，实现对电力负荷（或其他连续数值型指标）的更高精度建模与预测。

BiLSTM算法的流程如下：

（1）数据准备：首先，我们需要准备历史数据作为训练集。

（2）数据预处理：对于训练集中的数据，我们需要进行一些预处理操作，比如去除异常值、归一化等，以提高预测模型的准确性。

（3）网络构建：根据预处理后的训练集，我们构建BiLSTM网络模型。该模型包括输入层、隐藏层(双向LSTM层)和输出层。

（4）模型训练：采用 MSE 作为回归损失，Adam 优化器提升收敛速度与鲁棒性，同时监控 MAE 作为评估指标。

（5）模型评估：在训练完成后，我们需要对模型进行评估。这可以通过将训练集中的一部分数据作为测试集，来计算模型的预测误差和准确率。

二，代码

代码中文注释非常清晰，按照示例数据修改格式，替换数据集即可运行，数据集可以是csv或者excel表格。

部分代码如下：


if __name__ == "__main__":
    warnings.filterwarnings("ignore")  # 取消警告
    # 使用pandas模块的read_csv函数读取名为"电力负荷预测数据.csv"的文件。
    # 参数 'encoding' 设置为 'gb2312'，这通常用于读取中文字符，确保文件中的中文字符能够正确读取。
    # 读取的数据被存储在名为 'dataset' 的DataFrame变量中。
    dataset = pd.read_csv("电力负荷预测数据.csv", encoding='gb2312')
    # 下面是读取xlsx的方式，根据实际数据集文件选择是read_csv还是read_excel
    # dataset = pd.read_excel("数据集.xlsx", sheet_name='Sheet1', header=0)
    print(dataset)  # 显示dataset数据

    # 从dataset DataFrame中提取数据。
    # dataset.values将DataFrame转换为numpy数组。
    # [:,1:]，逗号前是行，逗号之后是列。这个表示选择所有行（:）和从第二列到最后一列（1:）的数据。
    # 这样做通常是为了去除第一列，这在第一列是索引或不需要的数据时很常见。
    # 只取第2列数据，要写成1:2；只取第3列数据，要写成2:3，取第2列之后(包含第二列)的所有数据，写成 1：
    # 单输入单步预测，就让values等于某一列数据，n_out = 1，n_in, num_samples, scroll_window 根据自己情况来
    # 单输入多步预测，就让values等于某一列数据，n_out > 1，n_in, num_samples, scroll_window 根据自己情况来
    # 多输入单步预测，就让values等于多列数据，n_out = 1，n_in, num_samples, scroll_window 根据自己情况来
    # 多输入多步预测，就让values等于多列数据，n_out > 1，n_in, num_samples, scroll_window 根据自己情况来
    values = dataset.values[:, 1:]
    # 如果第一列不是索引，需保留全部列的数据时，则使用下面这句代码，并把上面那句代码屏蔽
    # values = dataset.values[:, :]

    # 确保所有数据是浮点数
    # 将values数组中的数据类型转换为float32。
    # 这通常用于确保数据类型的一致性，特别是在准备输入到神经网络模型中时。
    values = values.astype('float32')

    # 下面是多特征输入，多步预测的案例
    n_in = 5  # 输入前5行的数据
    n_out = 2  # 预测未来2步的数据
    or_dim = values.shape[1]  # 记录特征数据维度
    # 默认是全部数据用于本次网络的训练与测试，也可以设定具体是数值，比如2000，这个数值不能超过实际的数据点
    num_samples = values.shape[0] - n_in - n_out
    # num_samples = 2000
    scroll_window = 1  # 如果等于1，下一个数据从第二行开始取。如果等于2，下一个数据从第三行开始取
    res = data_collation(values, n_in, n_out, or_dim, scroll_window, num_samples)

    # 把数据集分为训练集和测试集
    # 将前面处理好的DataFrame（data）转换成numpy数组，方便后续的数据操作。
    values = np.array(res)

    # 计算训练集的大小。
    # 设置80%作为训练集
    # int(...) 确保得到的训练集大小是一个整数。
    n_train_number = int(num_samples * 0.8)

    # 先划分数据集，在进行归一化，这才是正确的做法！
    Xtrain = values[:n_train_number, :n_in * or_dim]
    Ytrain = values[:n_train_number, n_in * or_dim:]
    Xtest = values[n_train_number:, :n_in * or_dim]
    Ytest = values[n_train_number:, n_in * or_dim:]

    # 对训练集和测试集进行归一化
    m_in = MinMaxScaler()
    vp_train = m_in.fit_transform(Xtrain)  # 注意fit_transform() 和 transform()的区别
    vp_test = m_in.transform(Xtest)  # 注意fit_transform() 和 transform()的区别
    m_out = MinMaxScaler()
    vt_train = m_out.fit_transform(Ytrain)  # 注意fit_transform() 和 transform()的区别
    vt_test = m_out.transform(Ytest)  # 注意fit_transform() 和 transform()的区别

    # 将训练集的输入数据vp_train重塑成三维格式。
    # 结果是一个三维数组，其形状为[样本数量, 时间步长, 特征数量]。
    vp_train = vp_train.reshape((vp_train.shape[0], n_in, or_dim))

    # 将测试集的输入数据vp_test重塑成三维格式。
    # 结果是一个三维数组，其形状为[样本数量, 时间步长, 特征数量]。
    vp_test = vp_test.reshape((vp_test.shape[0], n_in, or_dim))

    # 调用bilstm_model函数来建立BiLSTM模型
    model = bilstm_model()

    # 训练模型。指定批处理大小为72，训练轮数为100，将25%的数据用作验证集。
    # verbose=2表示在训练过程中会输出详细信息。
    history = model.fit(vp_train, vt_train, batch_size=72, epochs=100, validation_split=0.25, verbose=2)

。。。。。。

三，运行结果

资源下载：https://download.csdn.net/download/vvoennvv/92334677

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git