本文章内容只包含 如何划分数据集内容,不包含其他任何内容,不涉及任何原理讲解。

同时划分数据集的方式并不是唯一的,大家可以在时间精力运行的情况下进行相应的尝试,这里只列举一个划分方式。

1.创建根文件夹   test_Mydata

2.在 test_Mydata 文件夹下创建三个文件夹分别是 train文件夹、valid文件夹、data.yaml文件

(data.yaml 里面需要的代码在文章下方,不要着急一步一步来)

F:\test_Mydata\train

F:\test_Mydata\valid

F:\test_Mydata\data.yaml

3.、

在 train文件夹下创建两个文件夹 分别是 images文件夹、labels文件夹

F:\test_Mydata\train\images      F:\test_Mydata\train\labels

3.1 images里存放的需要训练的图片,labels里存放的是yolo训练所需的txt文件

(使用的拉框软件----Labelimg)

4.

 在 valid文件夹下创建两个文件夹 分别是 images文件夹、labels文件夹

(没错,和train文件一样)

F:\test_Mydata\valid\images      F:\test_Mydata\valid\labels

4.1 images里存放验证所需的图片,labels里存放的是yolo训练所需的txt文件

valid文件夹下的images里存放的是验证用的图片,相当于答案;如果不明白两者有什么不同,只是单纯的尝试一下yolo模型,那么可以将train文件中的图片剪切一些,放到validimages中,同时将labels里图片对应的txt文件放到valid的labels(这样会导致训练不准确,只适用于尝试

5.data.yaml

train: F:\test_Mydata\train\images #建议使用绝对路径
val: F:\test_Mydata\valid\images 


nc: 2    #与下方names中标签数相对应
names: ['a','b']    #有多少个标签,写多少个

这篇博客写的很好,比我的更加全面,可以仔细学习icon-default.png?t=N7T8https://blog.csdn.net/Pan_peter/article/details/129907710?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170796659216800197047268%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=170796659216800197047268&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-1-129907710-null-null.142^v99^pc_search_result_base5&utm_term=yolov8%E8%AE%AD%E7%BB%83&spm=1018.2226.3001.4187

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐