仅 1.01M 参数|超轻量羊脸识别模型 ,移动端也能跑
计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。羊只个体精准识别是智慧畜牧核心环节,传统耳标、RFID、烙印等方式存在易丢失、高成本、易损伤、难规模化等缺陷。基于面部生物特征的识别具备非接触、高唯一性、低成本优势,是规模化养殖的优选技术路径。SSMA-YOLO:一种轻量级的 YOLO 模型,具备增强的特征提取与融合能力,适用于无人
点击蓝字
关注我们
关注并星标
从此不迷路
计算机视觉研究院


公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
https://pmc.ncbi.nlm.nih.gov/articles/PMC12349333/pdf/sensors-25-04610.pdf
计算机视觉研究院专栏
Column of Computer Vision Institute
本文基于Sensors 2025刊发成果,系统解读面向资源受限终端的羊脸精准识别与模型轻量化技术方案,为畜禽个体标识、行为监测、精准饲喂提供可工程化的深度学习支撑。

PART/1
背景
1.1 行业刚需
羊只个体精准识别是智慧畜牧核心环节,传统耳标、RFID、烙印等方式存在易丢失、高成本、易损伤、难规模化等缺陷。基于面部生物特征的识别具备非接触、高唯一性、低成本优势,是规模化养殖的优选技术路径。
1.2 核心技术瓶颈
现有羊脸识别模型普遍存在三大痛点:
-
模型参数量与计算量过大,难以部署于移动端、嵌入式与边缘设备;
-
特征提取与多尺度融合效率不足,复杂遮挡、低光照场景鲁棒性弱;
-
精度与轻量化难以兼顾,工程落地性差。
为此,本文以YOLOv8n为基座,提出PFL‑YOLO轻量化羊脸识别模型,实现高精度与低算力的协同最优。
PART/2
数据集
2.1 数据采集
以甘肃临夏60 只澳湖杂交羊为对象,采用手机多视角采集:
-
水平:0°–180°;垂直:45°–135°;距离:0.25–1.0 m;
-
原始视频按 30 帧间隔抽帧,共获取 10225 帧图像。
2.2 数据清洗与增强
-
采用SSIM(阈值 0.75)剔除高相似冗余图像,保留 6418 张高质量样本;
-
经翻转、旋转、亮度、对比度等 6 种增强,扩充至12836 张;
-
按 8:1:1 划分为训练集、验证集、测试集。

多视角羊脸样本示例图

羊脸标注规范示意图
PART/3
模型架构与核心创新模块
PFL‑YOLO 在主干、颈部、检测头三级结构实施分组卷积、残差融合、参数共享、轻量注意力四维优化,整体架构如图所示。

PFL‑YOLO 整体网络架构
3.1 EHConv:高效混合卷积模块
-
引入分组卷积保持感受野并降低计算量;
-
嵌入ECA 通道注意力聚焦面部关键特征;
-
采用Hardswish激活函数适配终端推理。
3.2 RC2f:残差多尺度特征融合
-
基于Res2Net重构 C2f 结构,实现细粒度特征交互;
-
浅层细节特征与深层语义特征跨层融合;
-
轻量化 ECA 提升通道权重自适应能力。
3.3 ESPPF:高效空间金字塔池化
-
轻量化重构 SPPF,实现多尺度特征高效融合;
-
分组卷积 + ECA 进一步压缩参数量与 FLOPs。
3.4 PFDetect:参数融合检测头
-
跨层参数共享合并分支,显著降低计算冗余;
-
引入Channel Shuffle解决分组卷积信息隔离问题;
-
轻量注意力强化关键特征捕获。






各模块改进前后对比
PART/4
实验结果与性能分析
4.1 核心指标
-
mAP@50:99.5%
-
mAP@50:95:87.4%
-
参数量:1.01 M
-
计算量:3.3 GFLOPs
-
模型体积:2.1 MB
-
推理速度:11.2 ms/img,89.4 FPS
4.2 与主流轻量 YOLO 对比

主流轻量模型与 PFL‑YOLO 性能对比
4.3 消融实验
四大模块协同作用,在mAP@50 保持 99.5%前提下,参数量降至 YOLOv8n 的33.4%,计算量降至40.7%,实现精度‑效率最优平衡。
4.4 可视化验证
- 热力图:PFL‑YOLO 关注区域更大、聚焦更精准,正面羊脸特征捕获能力显著优于基线;
- 预测结果:正面视角置信度达95%,复杂场景鲁棒性突出。

模型热力图对比

模型预测结果对比
PART/5
工程价值与应用场景
终端部署友好:2.1 MB 超小体积,支持手机、嵌入式、边缘网关、监控摄像头部署;
养殖全场景适配:个体识别、精准饲喂、健康监测、行为分析、溯源管理;
泛化潜力:可快速迁移至牛、猪等畜禽面部识别任务。
PART/6
结论
本文提出的PFL‑YOLO是面向智慧畜牧的极致轻量化羊脸识别模型:
-
以 YOLOv8n 为基座,通过EHConv/RC2f/ESPPF/PFDetect四大创新实现结构优化;
-
在保持99.5% mAP@50高精度前提下,参数量仅 1.01 M、体积 2.1 MB;
-
完美平衡精度、计算量、部署性,为畜禽智能感知提供轻量化基准方案。
有相关需求的你可以联系我们!


END


转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
往期推荐
🔗
更多推荐
所有评论(0)