文章前瞻:优质数据集与检测系统精选

点击链接:更多数据集与系统目录清单

数据集与检测系统 数据集与检测系统
基于深度学习的道路积水检测系统 基于深度学习的道路垃圾检测系统
基于深度学习的道路裂缝检测系统 基于深度学习的道路交通事故检测系统
基于深度学习的道路病害检测系统 基于深度学习的道路积雪结冰检测系统
基于深度学习的汽车车牌检测系统 基于深度学习的井盖丢失破损检测系统
基于深度学习的行人车辆检测系统 基于深度学习的航拍行人检测系统
基于深度学习的车辆分类检测系统 基于深度学习的电动车头盔佩戴检测系统
基于深度学习的交通信号灯检测系统 基于深度学习的共享单车违停检测系统
基于深度学习的摆摊占道经营检测系统 基于深度学习的人员游泳溺水检测系统
基于深度学习的航拍水面垃圾检测系统 基于深度学习的水面垃圾检测系统
基于深度学习的水面船舶分类检测系统 基于深度学习的海洋垃圾检测系统
基于深度学习的救生衣穿戴检测系统 基于深度学习的海洋生物检测系统
基于深度学习的人员吸烟检测系统 基于深度学习的口罩佩戴检测系统
基于深度学习的烟雾和火灾检测系统 基于深度学习的人员睡岗玩手机检测系统
基于深度学习的人员摔倒检测系统 基于深度学习的人员姿势检测系统(站坐躺摔倒)
基于深度学习的工地安全穿戴检测系统 基于深度学习的安全帽检测系统
基于深度学习的反光背心穿戴检测系统 基于深度学习的吸烟玩手机行为检测系统
基于深度学习的工地挖掘机检测系统 基于深度学习的工地工程车检测系统
基于深度学习的人体手势检测系统 基于深度学习的消防灭火器检测系统
基于深度学习的人员高空作业检测系统 基于深度学习的水果分类检测系统
基于深度学习的农作物病害检测系统 基于深度学习的水稻病害检测系统
基于深度学习的害虫检测系统 基于深度学习的蓝莓成熟度检测系统
基于深度学习的草莓成熟度检测系统 基于深度学习的食品分类检测系统
基于深度学习的光伏板缺陷检测系统 基于深度学习的航拍光伏板检测系统
基于深度学习的建筑垃圾废料检测系统 基于深度学习的可回收/不可回收垃圾检测系统
基于深度学习的垃圾分类检测系统 基于深度学习的猪只行为动作检测系统
基于深度学习的动物分类检测系统 基于深度学习的明厨亮灶鼠患检测系统
基于深度学习的猫狗分类检测系统 基于深度学习的服饰分类检测系统
基于深度学习的电动车进电梯检测系统 基于深度学习的无人机设备检测系统
基于深度学习的树木倒塌检测系统 基于深度学习的电线杆杂物检测系统
基于深度学习的航拍树木检测系统 基于深度学习的学生课堂行为检测系统
基于深度学习的家具分类检测系统 基于深度学习的武器刀具检测系统

一、道路病害识别数据集介绍

【数据集】yolo道路病害检测数据集 3018 张,目标检测,包含YOLO/VOC格式标注,训练、验证、测试集已划分

数据集中标签包含1种分类names: ['pothole'],代表道路病害

检测场景为城市道路、乡镇道路、高速公路、园区内部道路等场景,可用于道路日常养护精准化、应急处置高效化、通行安全保障化等。

文章底部名片或主页私信获取数据集和系统~

1、数据概述

道路病害识别的重要性

道路作为交通网络的核心载体,其完好度直接关系行车安全与通行效率。裂缝、坑槽、沉陷等道路病害若未及时处理,会随车辆碾压不断恶化——轻则导致车辆颠簸、轮胎磨损,重则引发爆胎、车辆失控等事故,同时加速道路老化,增加后期维修成本。

传统道路病害检测存在明显短板:人工巡检依赖检测人员驾车或步行排查,不仅耗时耗力,还受肉眼识别能力限制,对细微裂缝、浅层坑槽等早期病害易漏判;检测结果依赖纸质记录或人工录入,数据整理滞后,难以及时支撑养护决策;在夜间、雨天等复杂环境下,人工检测安全性降低,精度也大幅下降,难以实现全时段、全覆盖监测。

YOLO算法凭借“实时动态检测+精准病害识别”的优势,精准破解上述难题:其一,可结合车载摄像头、无人机航拍或道路监控设备,快速覆盖大范围道路,无需人工逐段排查;其二,能精准识别裂缝、坑槽、网裂等多种病害,甚至捕捉毫米级早期裂缝,区分病害类型与严重程度,避免误判漏判;其三,检测数据可实时同步至道路养护平台,实现“病害即发现、信息即上传”,为及时养护提供关键支撑,推动道路管理从“被动维修”向“主动防控”转型。

基于YOLO的道路病害检测系统

  1. 日常养护精准化:YOLO通过定期巡检自动定位病害位置与类型,生成道路病害分布图谱,养护人员可据此制定针对性维修方案,无需全路段盲修。对早期轻微病害及时修补,避免病害扩大,延长道路使用寿命,降低整体养护成本。

  2. 应急处置高效化:暴雨、地震等灾害后,道路易出现塌陷、断裂等突发病害,YOLO可通过无人机快速航拍受灾路段,自动识别受损区域与病害严重程度,辅助养护部门快速掌握灾情,优先修复主干道、桥梁等关键路段,缩短交通中断时间。

  3. 养护规划科学化:长期积累的病害检测数据,可帮助管理部门分析不同路段的病害高发类型、老化速度,判断道路使用寿命与养护周期。结合车流、环境等因素,制定科学的养护计划与资金分配方案,提升养护资源利用效率。

  4. 通行安全保障化:在高速公路、城市快速路等车流密集路段,YOLO实时检测突发病害(如路面碎石、小型坑槽),立即联动交通诱导屏推送预警信息,提醒车辆减速避让,同时通知养护人员快速处置,减少因道路病害引发的交通事故。

该数据集含有 3018 张图片,包含Pascal VOC XML格式和YOLO TXT格式,用于训练和测试城市道路、乡镇道路、高速公路、园区内部道路等场景进行道路病害识别

图片格式为jpg格式,标注格式分别为:

YOLO:txt

VOC:xml

数据集均为手工标注,保证标注精确度。

2、数据集文件结构

pothole/

——test/

————Annotations/

————images/

————labels/

——train/

————Annotations/

————images/

————labels/

——valid/

————Annotations/

————images/

————labels/

——data.yaml

  • 该数据集已划分训练集样本,分别是:test目录(测试集)、train目录(训练集)、valid目录(验证集);
  • Annotations文件夹为Pascal VOC格式的XML文件 ;
  • images文件夹为jpg格式的数据样本;
  • labels文件夹是YOLO格式的TXT文件;
  • data.yaml是数据集配置文件,包含道路病害检测的目标分类和加载路径。

​​

Annotations目录下的xml文件内容如下:

<annotation>
	<folder></folder>
	<filename>images276_jpg.rf.514a43be2736c3e7785c8b047496f4cf.jpg</filename>
	<path>images276_jpg.rf.514a43be2736c3e7785c8b047496f4cf.jpg</path>
	<source>
		<database>roboflow.com</database>
	</source>
	<size>
		<width>640</width>
		<height>640</height>
		<depth>3</depth>
	</size>
	<segmented>0</segmented>
	<object>
		<name>pothole</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<occluded>0</occluded>
		<bndbox>
			<xmin>149</xmin>
			<xmax>305</xmax>
			<ymin>199</ymin>
			<ymax>300</ymax>
		</bndbox>
	</object>
	<object>
		<name>pothole</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<occluded>0</occluded>
		<bndbox>
			<xmin>289</xmin>
			<xmax>620</xmax>
			<ymin>380</ymin>
			<ymax>641</ymax>
		</bndbox>
	</object>
	<object>
		<name>pothole</name>
		<pose>Unspecified</pose>
		<truncated>0</truncated>
		<difficult>0</difficult>
		<occluded>0</occluded>
		<bndbox>
			<xmin>270</xmin>
			<xmax>615</xmax>
			<ymin>184</ymin>
			<ymax>402</ymax>
		</bndbox>
	</object>
	<metadata>
	</metadata>
</annotation>

labels目录下的txt文件内容如下:

0 0.46953125 0.51328125 0.0953125 0.0765625
0 0.63359375 0.47421875 0.07734375 0.0640625

3、数据集适用范围 

  • 目标检测场景,监控识别
  • yolo训练模型或其他模型
  • 城市道路、乡镇道路、高速公路、园区内部道路
  • 可用于道路日常养护精准化、应急处置高效化、通行安全保障化等。

4、数据集标注结果 

4.1、数据集内容 

  1. 场景视角:监控视角数据样本,人员视角数据样本,少量无人机视角数据样本
  2. 标注内容:names: ['pothole'],总计1个分类;
  3. 图片总量:3018 张图片数据;
  4. 标注类型:含有Pascal VOC XML格式和yolo TXT格式;

5、训练过程

5.1、导入训练数据

下载YOLOv8项目压缩包,解压在任意本地workspace文件夹中。

下载YOLOv8预训练模型,导入到ultralytics-main项目根目录下。

​​​​​​

ultralytics-main项目根目录下,创建data文件夹,并在data文件夹下创建子文件夹:Annotations、images、imageSets、labels,其中,将pascal VOC格式的XML文件手动导入到Annotations文件夹中,将JPG格式的图像数据导入到images文件夹中,imageSets和labels两个文件夹不导入数据。

data目录结构如下:

data/

——Annotations/   //存放xml文件

——images/          //存放jpg图像

——imageSets/

——labels/

整体项目结构如下所示:

​​​

5.2、数据分割

首先在ultralytics-main目录下创建一个split_train_val.py文件,运行文件之后会在imageSets文件夹下将数据集划分为训练集train.txt、验证集val.txt、测试集test.txt,里面存放的就是用于训练、验证、测试的图片名称。

import os
import random

trainval_percent = 0.9
train_percent = 0.9
xmlfilepath = 'data/Annotations'
txtsavepath = 'data/ImageSets'
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('data/ImageSets/trainval.txt', 'w')
ftest = open('data/ImageSets/test.txt', 'w')
ftrain = open('data/ImageSets/train.txt', 'w')
fval = open('data/ImageSets/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

5.3、数据集格式化处理

在ultralytics-main目录下创建一个voc_label.py文件,用于处理图像标注数据,将其从XML格式(通常用于Pascal VOC数据集)转换为YOLO格式。

convert_annotation函数

  • 这个函数读取一个图像的XML标注文件,将其转换为YOLO格式的文本文件。

  • 它打开XML文件,解析树结构,提取图像的宽度和高度。

  • 然后,它遍历每个目标对象(object),检查其类别是否在classes列表中,并忽略标注为困难(difficult)的对象。

  • 对于每个有效的对象,它提取边界框坐标,进行必要的越界修正,然后调用convert函数将坐标转换为YOLO格式。

  • 最后,它将类别ID和归一化后的边界框坐标写入一个新的文本文件

import xml.etree.ElementTree as ET
import os
from os import getcwd

sets = ['train', 'val', 'test']
classes = ['pothole'] # 根据标签名称填写类别
abs_path = os.getcwd()
print(abs_path)


def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = (box[0] + box[1]) / 2.0 - 1
    y = (box[2] + box[3]) / 2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return x, y, w, h


def convert_annotation(image_id):
    in_file = open('data/Annotations/%s.xml' % (image_id), encoding='UTF-8')
    out_file = open('data/labels/%s.txt' % (image_id), 'w')
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text),
             float(xmlbox.find('xmax').text),
             float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        b1, b2, b3, b4 = b
        # 标注越界修正
        if b2 > w:
            b2 = w
        if b4 > h:
            b4 = h
        b = (b1, b2, b3, b4)
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')


wd = getcwd()
for image_set in sets:
    if not os.path.exists('data/labels/'):
        os.makedirs('data/labels/')
    image_ids = open('data/ImageSets/%s.txt' % (image_set)).read().strip().split()
    list_file = open('data/%s.txt' % (image_set), 'w')
    for image_id in image_ids:
        list_file.write(abs_path + '/data/images/%s.jpg\n' % (image_id))
        convert_annotation(image_id)
    list_file.close()

 5.4、修改数据集配置文件

在ultralytics-main目录下创建一个data.yaml文件

train: data/train.txt
val: data/val.txt
test: data/test.txt

nc: 1
names: ['pothole']

5.5、执行命令

执行train.py

model = YOLO('yolov8s.pt')
results = model.train(data='data.yaml', epochs=200, imgsz=640, batch=16, workers=0)

也可以在终端执行下述命令:

yolo train data=data.yaml model=yolov8s.pt epochs=200 imgsz=640 batch=16 workers=0 device=0

5.6、模型预测 

你可以选择新建predict.py预测脚本文件,输入视频流或者图像进行预测。

代码如下:

import cv2
from ultralytics import YOLO

# Load the YOLOv8 model
model = YOLO("./best.pt") # 自定义预测模型加载路径

# Open the video file
video_path = "./demo.mp4" # 自定义预测视频路径
cap = cv2.VideoCapture(video_path) 

# Get the video properties
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
fps = cap.get(cv2.CAP_PROP_FPS)

# Define the codec and create VideoWriter object
fourcc = cv2.VideoWriter_fourcc(*'mp4v')  # Be sure to use lower case
out = cv2.VideoWriter('./outputs.mp4', fourcc, fps, (frame_width, frame_height)) # 自定义输出视频路径

# Loop through the video frames
while cap.isOpened():
    # Read a frame from the video
    success, frame = cap.read()

    if success:
        # Run YOLOv8 inference on the frame
        # results = model(frame)
        results = model.predict(source=frame, save=True, imgsz=640, conf=0.5)

        results[0].names[0] = "道路积水"
        # Visualize the results on the frame
        annotated_frame = results[0].plot()

        # Write the annotated frame to the output file
        out.write(annotated_frame)

        # Display the annotated frame (optional)
        cv2.imshow("YOLOv8 Inference", annotated_frame)

        # Break the loop if 'q' is pressed
        if cv2.waitKey(1) & 0xFF == ord("q"):
            break
    else:
        # Break the loop if the end of the video is reached
        break

# Release the video capture and writer objects
cap.release()
out.release()
cv2.destroyAllWindows()

图片推理,代码如下:

import warnings

warnings.filterwarnings('ignore')
from ultralytics import YOLO

if __name__ == '__main__':
    model = YOLO('models/best.pt')
    model.predict(source='test_pic',
                  imgsz=640,
                  save=True,
                  conf=0.25
                  )

也可以直接在命令行窗口或者Annoconda终端输入以下命令进行模型预测:

yolo predict model="best.pt" source='demo.jpg'

6、获取数据集 

文章底部名片或主页私信获取数据集或检测系统~

二、YOLO道路病害检测系统

1、功能介绍

1. 模型管理

支持自定义上传模型文件,一键加载所选模型,基于 YOLO 框架进行推理。

2. 图片检测

    - 支持上传本地图片文件,自动完成格式校验。

    - 对上传图片进行目标检测,检测结果以带有边框和标签的图片形式返回并展示。

    - 检测结果可下载保存。

3. 视频检测与实时流

    - 支持上传本地视频文件,自动完成格式校验。

    - 对视频逐帧检测,检测结果通过 MJPEG 流实时推送到前端页面,用户可边看边等。

    - 支持摄像头实时检测(如有接入摄像头)。

4. 置信度阈值调节

    - 前端可实时调整检测置信度阈值,动态影响检测结果。

    - 阈值调整后,后端推理自动应用新阈值,无需重启。

5. 日志与状态反馈

    - 前端集成日志区,实时显示模型加载、推理、文件上传等操作的进度与结果。

    - 检测异常、错误信息及时反馈,便于排查。

    - 一键清空日志,笔面长期占用内存。

 ​​​​  

2、创建环境并安装依赖:

conda create -n ultralytics-env python=3.10
conda activate ultralytics-env
pip install -r requirements.txt

3、启动项目

python app.py

打开浏览器访问:http://localhost:5000

4、效果展示

4.1、推理效果

以武器刀具识别为例,效果如下:

      

4.2、日志文本框

4.3、摄像头检测

以红绿灯检测为例:

5、前端核心页面代码

<!doctype html>
<html lang="zh-CN">

<head>
    <meta charset="utf-8">
    <meta name="viewport" content="width=device-width,initial-scale=1">
    <title>视觉检测系统 - Web UI</title>
    <link rel="stylesheet" href="/static/style.css">
    <link rel="icon" href="/favicon.ico">
</head>

<body>
    <div class="container main-flex">
        <!-- 左侧内容区 -->
        <div class="left-content">
            <header>
                <h1>YOLO道路病害检测系统</h1>
                <div id="currentModelDisplay" class="modelDisplay" title="当前模型">当前模型:未上传模型</div>
            </header>
            <main>
                <div class="videoPanel">
                    <div class="pane">
                        <h3>原图 / 视频</h3>
                        <div class="preview" id="srcPreview">预览区</div>
                    </div>
                    <div class="pane">
                        <h3>检测结果</h3>
                        <div class="preview" id="detPreview">检测结果</div>
                    </div>
                </div>
                <section class="logArea">
                    <div class="logHeader">
                        <h3>日志</h3>
                    </div>
                    <div class="logInner">
                        <div id="logs" class="logs"></div>
                    </div>
                </section>
            </main>
        </div>
        <!-- 右侧按钮栏 -->
        <aside class="right-bar">
            <!-- 1. 模型上传/加载区 -->
            <section class="model-section">
                <button id="uploadModelBtn" class="ghost">上传模型
                    <input id="modelFileInput" type="file" accept=".pt" title="选择 .pt 模型文件">
                </button>
                <button id="loadModel">加载模型</button>
            </section>

            <!-- 2. 检测方式选择区 -->
            <section class="detect-mode-section">
                <div class="detect-mode-title">请选择检测方式</div>
                <div class="detect-mode-radio-group">
                    <label><input type="radio" name="detectMode" value="upload" checked> 图片/视频</label>
                    <label><input type="radio" name="detectMode" value="camera"> 摄像头</label>
                </div>
                <div id="detectModeUpload" class="detect-mode-panel">
                    <div class="uploaded-file-name">
                        <span id="uploadedFileName" class="placeholder">未选择文件</span>
                    </div>
                    <div style="height: 22px;"></div>
                    <button id="uploadBtn">上传文件
                        <input id="fileInput" type="file" accept="image/*,video/*" title="上传图片或视频" aria-label="上传图片或视频">
                    </button>
                </div>
                <div id="detectModeCamera" class="detect-mode-panel" style="display:none;">
                    <button id="cameraDetectBtn" class="ghost">开启摄像头</button>
                    <div id="cameraPreview" class="camera-preview">
                        <video id="localCameraVideo" autoplay muted playsinline></video>
                        <div class="camera-controls">
                            <button id="stopCameraBtn" class="ghost">关闭摄像头</button>
                        </div>
                    </div>
                </div>
                <div class="confWrap">
                    <label class="conf">置信度
                        <input id="confRange" type="range" min="0.01" max="0.99" step="0.01" value="0.5">
                        <input id="confValue" type="number" min="0.01" max="0.99" step="0.01" value="0.5">
                    </label>
                </div>
            </section>

            <!-- 3. 操作按钮区 -->
            <section class="action-btn-section">
                <button id="startBtn" disabled class="start">开始检测</button>
                <button id="stopBtn" disabled class="stop">停止</button>
                <button id="clearLogs" class="ghost">清空日志</button>
            </section>
        </aside>
    </div>
    <script src="/static/app.js"></script>
</body>

</html>

6、代码获取

文章底部名片或私信获取系统源码和数据集~

 点击链接:获取更多数据集与系统目录清单

以上内容均为原创。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐