PyTorch 入门：构建简单神经网络实现图像分类

下面将逐步指导如何使用PyTorch构建一个全连接神经网络，在MNIST手写数字数据集上实现图像分类。MNIST包含28×28像素的灰度手写数字图像（0-9共10类）。

2501_93895411

305人浏览 · 2025-10-31 15:58:38

2501_93895411 · 2025-10-31 15:58:38 发布

PyTorch入门：构建简单神经网络实现图像分类

下面将逐步指导如何使用PyTorch构建一个全连接神经网络，在MNIST手写数字数据集上实现图像分类。MNIST包含28×28像素的灰度手写数字图像（0-9共10类）。

1. 环境准备

首先导入所需库：

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

2. 数据预处理

使用torchvision加载MNIST数据，并进行标准化处理：

# 数据转换：转换为Tensor并归一化到[-1,1]
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

# 加载数据集
train_data = datasets.MNIST(root='./data', train=True, download=True, transform=transform)
test_data = datasets.MNIST(root='./data', train=False, transform=transform)

# 创建数据加载器
train_loader = DataLoader(train_data, batch_size=64, shuffle=True)
test_loader = DataLoader(test_data, batch_size=64)

3. 构建神经网络模型

定义一个包含两个隐藏层的全连接网络：

class NeuralNet(nn.Module):
    def __init__(self):
        super(NeuralNet, self).__init__()
        self.fc1 = nn.Linear(28*28, 128)  # 输入层：784像素 -> 128神经元
        self.fc2 = nn.Linear(128, 64)     # 隐藏层：128 -> 64
        self.fc3 = nn.Linear(64, 10)      # 输出层：64 -> 10类别
        
    def forward(self, x):
        x = x.view(-1, 28*28)            # 展平图像 [batch, 784]
        x = torch.relu(self.fc1(x))       # ReLU激活
        x = torch.relu(self.fc2(x))
        x = self.fc3(x)                   # 输出层无需激活
        return x

model = NeuralNet()

4. 定义损失函数和优化器

criterion = nn.CrossEntropyLoss()         # 交叉熵损失
optimizer = optim.Adam(model.parameters(), lr=0.001)  # Adam优化器

5. 训练模型

epochs = 5  # 训练轮数

for epoch in range(epochs):
    for images, labels in train_loader:
        # 前向传播
        outputs = model(images)
        loss = criterion(outputs, labels)
        
        # 反向传播
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
    
    print(f'Epoch [{epoch+1}/{epochs}], Loss: {loss.item():.4f}')

6. 模型评估

model.eval()  # 切换为评估模式
correct = 0
total = 0

with torch.no_grad():  # 禁用梯度计算
    for images, labels in test_loader:
        outputs = model(images)
        _, predicted = torch.max(outputs, 1)  # 获取预测类别
        total += labels.size(0)
        correct += (predicted == labels).sum().item()

print(f'测试准确率: {100 * correct / total:.2f}%')

关键概念解释

张量（Tensor）：PyTorch基础数据结构，支持GPU加速
自动微分（Autograd）：通过loss.backward()自动计算梯度
计算图：动态构建计算路径，便于梯度传播
激活函数：ReLU引入非线性，公式：$f(x) = \max(0, x)$
交叉熵损失：分类任务常用损失函数，定义为： $$ \mathcal{L} = -\sum_{i=1}^{N} y_i \log(\hat{y}_i) $$ 其中$y_i$为真实标签，$\hat{y}_i$为预测概率

改进建议

使用卷积神经网络（CNN）提升图像识别精度
添加Dropout层防止过拟合
使用学习率调度器（如StepLR）
尝试其他优化器（如RMSprop）

完整代码约50行，可在GPU环境下运行（将张量移至GPU：images = images.to(device)）。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git