模型训练可视化、验证、评估

但因为wandb.ai需要收费，所以推荐使用Pytorch官网提供的Tensor Boadr。2.获取数据，得到预测值:out ,大小为[64,10],类型为tensor表示每次取出64条数据，共10种类型。通过生成csv文件，直观的感受预测值与真实值是否都匹配，从而验证模型建立的好快。1.创建一个空的二维numpy(),列表与预期想要的csv列数相同，行数为0。将预测值和真实值通过混淆矩阵的方

天真__

759人浏览 · 2025-07-17 18:19:45

天真__ · 2025-07-17 18:19:45 发布

一、模型训练可视化

模型训练可视化可以通过wandb.ai或Tensor Board完成。但因为wandb.ai需要收费，所以推荐使用Pytorch官网提供的Tensor Boadr。

1.1准备工作

导入tensorboard操作模块

from torch.utils.tensorboard import SummaryWriter

指定tensorboard日志保存路径：可以指定多个实例对象

dir = os.path.dirname(__file__)
tbpath = os.path.join(dir, "tensorboard")
# 指定tensorboard日志保存路径
writer = SummaryWriter(log_dir=tbpath)

1.2 保存训练过程曲线

记录训练数据

# 记录训练数据到可视化面板
writer.add_scalar("Loss/train", loss, epoch)
writer.add_scalar("Accuracy/train", acc, epoch)

模型训练后关闭

writer.close()

1.3 查看保存的曲线图

安装：pip install tensorboard

在训练完成后，查看训练结果，在当前目录下，打开控制台窗口：

tensorboard --logdir=runs

控制台会提示一个访问地址，用浏览器直接访问即可。

http://localhost:6006/

点击http://localhost:6006/后进入可视化界面

具体使用案例:

writer = SummaryWriter()
for epoch in range(epochs):
    acc_total = 0
    total_loss = 0
    for i,(x,y) in enumerate(data_loader):
        x, y = x.to(device), y.to(device)
        out = model(x)
        out1 = torch.argmax(out, dim=1)
        acc_total += (out1 == y).sum().item()
        loss = loss_fn(out, y)
        total_loss += loss.item()
        opt.zero_grad()
        loss.backward()
        opt.step()
    torch.save(model.state_dict(),model_dir)
    print("epoch:",epoch,"loss:",total_loss/len(data_loader.dataset),'acc:',acc_total/len(data_loader.dataset))
    #将平均每个样本的损失值变化可视化
    writer.add_scalar("loss/train",total_loss/len(data_loader.dataset),epoch)
    #将平均每个样本的准确率变化可视化
    writer.add_scalar("acc/train",acc_total/len(data_loader.dataset),epoch)

效果如下:

二、模型的验证

通过生成csv文件，直观的感受预测值与真实值是否都匹配，从而验证模型建立的好快。

创建csv文件的步骤:

1.创建一个空的二维numpy(),列表与预期想要的csv列数相同，行数为0

2.获取数据，得到预测值:out ,大小为[64,10],类型为tensor表示每次取出64条数据，共10种类型

    for x ,y in val_dataloader:
        x = x.to(device)
        y = y.to(device)
        out = model(x)

3.类型转换, 因为:创建csv文件一般使用numpy类型

'''
类型转换
预测值数据[64,10]
pred = torch.detach(out).cpu().numpy() ->numpy类型
detach->返回一个不需要计算梯度的张量
.cpu()-> 将张量从GPU转到CPU上，因为NumPy数组只能在CPU上处理
.numpy()转换为numpy类型
[64]
p1 = torch.argmax(out,dim=1) ->torch类型
p2 =p1.unsqueeze(1).detach().cpu().numpy()
真实值:
label = y.unsqueeze(1).detach().cpu().numpy()
'''
pred = torch.detach(out).cpu().numpy()
        #[64]
        p1 = torch.argmax(out, dim=1)
        #
        p2 = p1.unsqueeze(axis=1).detach().cpu().numpy()
        label = y.unsqueeze(axis=1).detach().cpu().numpy()

4.拼接

batch_data = np.concatenate((pred,p2,label), axis=1)
total_data = np.concatenate((total_data,batch_data),axis=0)

5.创建csv文件

#将数据集的类别存入class_names中
class_names = env_dataset.classes

#构建csv的第一行，即列名
pd_column =[*class_names,'pred','label']
#选择文件生成的路径
csv_path = os.path.relpath(os.path.join(os.path.dirname(__file__),'results','results.csv'))
#生成csv文件
pd.DataFrame(total_data,columns=pd_column).to_csv(csv_path,index=False)

完整代码如下:

env_dataset = MNIST(
    root=data_dir,
    train=False,

    transform=transforms,
    download=False,
)
total_data = np.empty((0,12))
with torch.no_grad():
    
    for x ,y in val_dataloader:
        x = x.to(device)
        y = y.to(device)
        #预测值数据[64,10]
        out = model(x)
        #[64,10]
        pred = torch.detach(out).cpu().numpy()
        #[64]
        p1 = torch.argmax(out, dim=1)
        #
        p2 = p1.unsqueeze(axis=1).detach().cpu().numpy()
        label = y.unsqueeze(axis=1).detach().cpu().numpy()
        batch_data = np.concatenate((pred,p2,label), axis=1)
        total_data = np.concatenate((total_data,batch_data),axis=0)


class_names = env_dataset.classes
#构建csv的第一行，即列名
pd_column =[*class_names,'pred','label']
csv_path = os.path.relpath(os.path.join(os.path.dirname(__file__),'results','results.csv'))
pd.DataFrame(total_data,columns=pd_column).to_csv(csv_path,index=False)

三、模型评估

知识点:混淆矩阵
将预测值和真实值通过混淆矩阵的方式进行展示，并由此评估模型的好坏

相关代码：

import pandas as pd
import os
from sklearn.metrics import classification_report

csv_path = os.path.relpath(os.path.join(os.path.dirname(__file__),'results','result.csv'))
# 读取csv
csvdata = pd.read_csv(csv_path,index_col=0)
#拿到真实值
true_labe = csvdata['label'].values
#拿到预测标签
true_pred = csvdata['pred'].values

#根据预测值和真实值生成分类报告
report = classification_report(y_true=true_labe,y_pred=true_pred)
print(report)

运行效果：

从混淆矩阵可以计算多种评估指标：

准确率(Accuracy) = (TP+TN)/(TP+TN+FP+FN)

精确率/查准率(Precision) = TP/(TP+FP)

召回率/查全率(Recall/Sensitivity) = TP/(TP+FN)

特异度(Specificity) = TN/(TN+FP)

F1分数 = 2×(Precision×Recall)/(Precision+Recall)

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git