keras全卷积神经网络（CNN）实现时间序列分类

本文是翻译的keras库中的代码示例。

钦臣

1004人浏览 · 2024-02-01 16:29:26

钦臣 · 2024-02-01 16:29:26 发布

文章目录

前言
一、导入库
二、加载数据：FordA 数据集
三、可视化数据
四、标准化数据
五、构建模型
六、训练模型
七、根据测试数据评估模型
八、绘制模型的训练和验证损失

前言

本文是翻译的keras库中的代码示例，点击跳转原链接

一、导入库

import keras
import numpy as np
import matplotlib.pyplot as plt

二、加载数据：FordA 数据集

数据集说明
在这里使用的数据集称为 FordA。数据来自 UCR 存档。数据集包含 3601 个训练实例和另外 1320 个测试实例。每个时间序列对应于电机传感器捕获的发动机噪声测量值。对于此任务，目标是自动检测是否存在特定问题引擎。问题在于平衡的二元分类任务。的完整描述这个数据集可以在这里找到。

读取 TSV 数据
我们将使用该文件进行训练，将该文件用于测试。此数据集的简单性使我们能够有效地演示如何使用 ConvNet 进行时间序列分类。在此文件中，第一列对应于标签：FordA_TRAINFordA_TEST

def readucr(filename):
    data = np.loadtxt(filename, delimiter="\t")
    y = data[:, 0]
    x = data[:, 1:]
    return x, y.astype(int)


root_url = "https://raw.githubusercontent.com/hfawaz/cd-diagram/master/FordA/"

x_train, y_train = readucr(root_url + "FordA_TRAIN.tsv")
x_test, y_test = readucr(root_url + "FordA_TEST.tsv")

三、可视化数据

在这里，我们可视化数据集中每个类的一个时间序列示例

classes = np.unique(np.concatenate((y_train, y_test), axis=0))

plt.figure()
for c in classes:
    c_x_train = x_train[y_train == c]
    plt.plot(c_x_train[0], label="class " + str(c))
plt.legend(loc="best")
plt.show()
plt.close()

在这里插入图片描述

四、标准化数据

我们的时间序列已经处于单一长度（500）中。但是，它们的值是通常在各种范围内。这对于神经网络来说并不理想; 一般来说，我们应该设法使输入值归一化。对于此特定数据集，数据已进行 z 规范化：每个时间序列样本均值等于零，标准差等于 1。这种类型的归一化对于时间序列分类问题非常常见。

请注意，此处使用的时间序列数据是单变量的，这意味着我们只有一个通道每个时间序列示例。因此，我们将时间序列转换为具有一个通道的多变量序列通过 numpy 使用简单的重塑。这将使我们能够构建一个易于适用于多变量时间的模型。

x_train = x_train.reshape((x_train.shape[0], x_train.shape[1], 1))
x_test = x_test.reshape((x_test.shape[0], x_test.shape[1], 1))
#计数事先的类数
num_classes = len(np.unique(y_train))
#现在我们随机播放训练集，因为我们将使用该选项 以后训练时。validation_split
idx = np.random.permutation(len(x_train))
x_train = x_train[idx]
y_train = y_train[idx]
#将标签标准化为正整数。 然后，预期的标签将为 0 和 1。
y_train[y_train == -1] = 0
y_test[y_test == -1] = 0

五、构建模型

我们构建了一个最初在本文中提出的全卷积神经网络。该实现基于此处提供的 TF 2 版本。发现以下超参数（kernel_size、过滤器、BatchNorm 的用法）通过使用 KerasTuner 进行随机搜索。

def make_model(input_shape):
    input_layer = keras.layers.Input(input_shape)

    conv1 = keras.layers.Conv1D(filters=64, kernel_size=3, padding="same")(input_layer)
    conv1 = keras.layers.BatchNormalization()(conv1)
    conv1 = keras.layers.ReLU()(conv1)

    conv2 = keras.layers.Conv1D(filters=64, kernel_size=3, padding="same")(conv1)
    conv2 = keras.layers.BatchNormalization()(conv2)
    conv2 = keras.layers.ReLU()(conv2)

    conv3 = keras.layers.Conv1D(filters=64, kernel_size=3, padding="same")(conv2)
    conv3 = keras.layers.BatchNormalization()(conv3)
    conv3 = keras.layers.ReLU()(conv3)

    gap = keras.layers.GlobalAveragePooling1D()(conv3)

    output_layer = keras.layers.Dense(num_classes, activation="softmax")(gap)

    return keras.models.Model(inputs=input_layer, outputs=output_layer)
model = make_model(input_shape=x_train.shape[1:])
keras.utils.plot_model(model, show_shapes=True)

六、训练模型

epochs = 500
batch_size = 32

callbacks = [
    keras.callbacks.ModelCheckpoint(
        "best_model.keras", save_best_only=True, monitor="val_loss"
    ),
    keras.callbacks.ReduceLROnPlateau(
        monitor="val_loss", factor=0.5, patience=20, min_lr=0.0001
    ),
    keras.callbacks.EarlyStopping(monitor="val_loss", patience=50, verbose=1),
]
model.compile(
    optimizer="adam",
    loss="sparse_categorical_crossentropy",
    metrics=["sparse_categorical_accuracy"],
)
history = model.fit(
    x_train,
    y_train,
    batch_size=batch_size,
    epochs=epochs,
    callbacks=callbacks,
    validation_split=0.2,
    verbose=1,
)

七、根据测试数据评估模型

model = keras.models.load_model("best_model.keras")

test_loss, test_acc = model.evaluate(x_test, y_test)

print("Test accuracy", test_acc)
print("Test loss", test_loss)

八、绘制模型的训练和验证损失

metric = "sparse_categorical_accuracy"
plt.figure()
plt.plot(history.history[metric])
plt.plot(history.history["val_" + metric])
plt.title("model " + metric)
plt.ylabel(metric, fontsize="large")
plt.xlabel("epoch", fontsize="large")
plt.legend(["train", "val"], loc="best")
plt.show()
plt.close()

在这里插入图片描述

我们可以看到训练准确率在 100 个 epoch 后如何达到近 0.95。但是，通过观察验证精度，我们可以看到网络仍然需要训练直到验证和训练准确率达到接近 0.97 200 个时代后。超过200个时代，如果我们继续训练，验证准确率将开始下降，而训练准确率将继续提高：模型开始过拟合。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git