红外小目标检测新突破！YOLO‑HVS：受人类视觉启发，精准抗遮挡、实时更高效

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。SSMA-YOLO：一种轻量级的 YOLO 模型，具备增强的特征提取与融合能力，适用于无人机航拍的船舶图像检测。，基于 YOLOv8 融合人类视觉系统（HVS）特性，在复杂遮挡、低信噪比下实现高精度、轻量化实时检测

计算机视觉研究院

535人浏览 · 2026-04-21 09:01:23

计算机视觉研究院 · 2026-04-21 09:01:23 发布

点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜计算机视觉研究院

学习群｜扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12293038/pdf/biomimetics-10-00451.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

在无人机巡检、安防监控、军事预警等场景中，红外小目标检测因目标像素少、纹理缺失、易被背景噪声淹没，一直是技术难题。近日，山东理工大学团队提出YOLO‑HVS 算法，基于 YOLOv8 融合人类视觉系统（HVS）特性，在复杂遮挡、低信噪比下实现高精度、轻量化实时检测。

PART/1

痛点

核心痛点：红外小目标检测的两大难题

背景干扰强：植被、阴影、热噪声易造成误检，小目标被遮挡后特征丢失。
多尺度提取难：无人机飞行高度变化，目标尺寸跨度大，常规模型难以兼顾。

现有算法要么精度不足，要么参数量大、速度慢，无法满足实时部署需求。

PART/2

方案

创新方案：两大核心模块，精准攻克难题

团队以 YOLOv8 为基线，打造YOLO‑HVS架构，核心升级两大模块：

1. MultiSEAM 多尺度空间增强注意力模块

采用三分支并行（patch=6/7/8），兼顾局部细节与全局上下文。
深度可分离卷积提取空间特征，逐点卷积融合通道信息。
抑制背景噪声、增强被遮挡目标特征
，解决遮挡导致的漏检问题。

MultiSEAM 结构示意图

2. C2f_DWR 区域语义双残差模块

替换 YOLOv8 原 C2f 模块，用膨胀卷积 + 双阶段残差（区域残差→语义残差）。
扩大感受野，高效捕获多尺度上下文，降低计算量、提升检测效率。

DWR 模块网络结构

PART/3

数据集

数据集：自建更贴合真实场景

为验证泛化性，团队构建DroneRoadVehicles 红外数据集：

1028 张红外图像，拍摄高度 70–300m，覆盖大 / 中 / 小多尺度目标。
包含高速、停车场、十字路口等复杂场景，昼夜、晴雾天气全覆盖。

多场景示例

不同高度对比

目标类别

PART/4

实验结果

实验结果：精度提升、轻量高效

团队在公开数据集DroneVehicle与自建数据集上全面测试：

1. 关键指标（对比 YOLOv8）

DroneVehicle：mAP50 达 83.4%，提升 1.1%；参数量仅增 2.3M，GFLOPs 仅增 0.1G。
自建数据集：mAP50 达 97.8%，提升 0.7%，遮挡与低信噪比场景优势显著。

DroneVehicle 对比结果

自建数据集对比结果

2. 消融实验验证

MultiSEAM：提升抗遮挡能力，mAP50+0.4%。
C2f_DWR：优化多尺度提取，降低计算量 3.7%。
组合使用：精度与效率双优。

消融实验结果

3. 可视化对比

小目标 + 强噪声场景：YOLOv8 漏检，YOLO‑HVS 精准检出。
常规目标：检测置信度显著更高，输出更可靠。

检测效果对比图

PART/5

总结

YOLO‑HVS 以人类视觉机制为灵感，通过 MultiSEAM 与 C2f_DWR 双模块升级，在红外小目标、复杂遮挡、多尺度变化三大难点上实现突破，同时保持轻量化与实时性。

未来团队将进一步研究动态感受野调整，适配极端尺度变化场景，为无人机红外监控、安防预警等落地提供更强技术支撑。

有相关需求的你可以联系我们！

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

往期推荐

🔗

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git