计算机视觉检测之yolo模型训练

yolo open-cv实战，涉及模型训练（在b站上跟学，现在做一个总结）

Ap1437951923

990人浏览 · 2025-11-05 16:14:42

Ap1437951923 · 2025-11-05 16:14:42 发布

计算机视觉检测之yolo模型训练

基于yolo11n.pt模型，在新数据集上训练，使模型能够识别新事物

yolo11n.pt模型识别汽车结果如下：
在这里插入图片描述

在新数据集上训练，得到新模型shu.pt，新模型能够识别如下图片：
在这里插入图片描述

一、环境准备

安装minconda

创建虚拟环境：conda create -n yolo python=3.12

进入虚拟环境：conda activate yolo

在虚拟环境安装以下第三方库

 pip install torch torchvision torchaudio jupyter

前三个必须安装，最后一个可以不用安装。这里torch torchvision torchaudio都是cpu版本，因为数据和模型都不大，本次训练可以在cpu进行。有cuda的电脑可以安装cuda版本的，训练速度会更快。

二、程序准备

下载ultralytics-8.3.55源代码，需要把它编译成python的第三方库

源码地址：https://github.com/ultralytics/ultralytics/releases

此处下载的源码版本是ultralytics-8.3.55
在这里插入图片描述

下载后解压，这里使用pycharm打开，选用上面的虚拟环境yolo作为编译环境

在这里插入图片描述

**切换目录到ultralytics-8.3.55（源代码所在的文件夹），**命令行输入以下指令，将ultralytics-8.3.55安装到虚拟环境中，作为第三方库

pip install -e .
在这里插入图片描述

然后命令行敲入pip list，看到第三方库已经生成

在这里插入图片描述

三、数据准备

使用labelImg.exe标注训练数据

地址：https://github.com/HumanSignal/labelImg/releases/tag/v1.8.1

在这里插入图片描述

数据标注
在这里插入图片描述

这里一共准备了51张图片，其中10张作为验证集，40张作训练集，数据放置目录如下：

在这里插入图片描述

四、训练

模型准备，下载yolo11n.pt模型

地址：https://docs.ultralytics.com/zh/models/yolo11/#performance-metrics 需要科学上网

在这里插入图片描述

将yolo11n.pt模型放在 ultralytics-8.3.55 文件夹下。
datasets、icon.yaml、train.py, yolo11n.pt的放置位置如下：在这里插入图片描述

icon.yaml的内容为：

path: icon # dataset root dir
train: images/train
val: images/val
test:  

# Classes
names:
  0: shu

新建一个train.py文件训练模型，内容如下：

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="icon.yaml", workers = 0, epochs=300, batch=16)

点击运行即可训练模型。

五、测试

本次训练只在cpu上进行，大概耗时1小时50分。训练后，模型所在位置：
在这里插入图片描述

将模型复制到与train.py所在目录同级的位置，改名为shu.pt

现在，可以使用新训练的模型预测数据啦（source是待预测的图片地址）：

from ultralytics import YOLO
yolo = YOLO(model='./shu.pt', task='detect')
result = yolo(source=r'E:\code\ultralytics-8.3.55\datasets\icon\test\1350.jpg', save = True)

上述预测代码执行后，结果会保存在runs/detect/predict文件夹下
在这里插入图片描述

打开即可。(左图是原图右图是模型检测后的图片)

在这里插入图片描述

原文链接：https://www.bilibili.com/video/BV18EWyzHE4j

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git