点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式

https://pmc.ncbi.nlm.nih.gov/articles/PMC12349333/pdf/sensors-25-04610.pdf

计算机视觉研究院专栏

Column of Computer Vision Institute

本文基于Sensors 2025刊发成果,系统解读面向资源受限终端的羊脸精准识别与模型轻量化技术方案,为畜禽个体标识、行为监测、精准饲喂提供可工程化的深度学习支撑。

PART/1

    背景   

1.1 行业刚需

羊只个体精准识别是智慧畜牧核心环节,传统耳标、RFID、烙印等方式存在易丢失、高成本、易损伤、难规模化等缺陷。基于面部生物特征的识别具备非接触、高唯一性、低成本优势,是规模化养殖的优选技术路径。

1.2 核心技术瓶颈

现有羊脸识别模型普遍存在三大痛点:

  • 模型参数量与计算量过大,难以部署于移动端、嵌入式与边缘设备;

  • 特征提取与多尺度融合效率不足,复杂遮挡、低光照场景鲁棒性弱;

  • 精度与轻量化难以兼顾,工程落地性差。

为此,本文以YOLOv8n为基座,提出PFL‑YOLO轻量化羊脸识别模型,实现高精度与低算力的协同最优。

PART/2

     数据集   

2.1 数据采集

以甘肃临夏60 只澳湖杂交羊为对象,采用手机多视角采集:

  • 水平:0°–180°;垂直:45°–135°;距离:0.25–1.0 m;

  • 原始视频按 30 帧间隔抽帧,共获取 10225 帧图像。

2.2 数据清洗与增强

  • 采用SSIM(阈值 0.75)剔除高相似冗余图像,保留 6418 张高质量样本;

  • 经翻转、旋转、亮度、对比度等 6 种增强,扩充至12836 张

  • 按 8:1:1 划分为训练集、验证集、测试集。

 多视角羊脸样本示例图 

羊脸标注规范示意图

PART/3

     模型架构与核心创新模块   

PFL‑YOLO 在主干、颈部、检测头三级结构实施分组卷积、残差融合、参数共享、轻量注意力四维优化,整体架构如图所示。

 PFL‑YOLO 整体网络架构

3.1 EHConv:高效混合卷积模块

  • 引入分组卷积保持感受野并降低计算量;

  • 嵌入ECA 通道注意力聚焦面部关键特征;

  • 采用Hardswish激活函数适配终端推理。

3.2 RC2f:残差多尺度特征融合

  • 基于Res2Net重构 C2f 结构,实现细粒度特征交互;

  • 浅层细节特征与深层语义特征跨层融合;

  • 轻量化 ECA 提升通道权重自适应能力。

3.3 ESPPF:高效空间金字塔池化

  • 轻量化重构 SPPF,实现多尺度特征高效融合;

  • 分组卷积 + ECA 进一步压缩参数量与 FLOPs。

3.4 PFDetect:参数融合检测头

  • 跨层参数共享合并分支,显著降低计算冗余;

  • 引入Channel Shuffle解决分组卷积信息隔离问题;

  • 轻量注意力强化关键特征捕获。

各模块改进前后对比

PART/4

     实验结果与性能分析   

4.1 核心指标

  • mAP@50:99.5%

  • mAP@50:95:87.4%

  • 参数量:1.01 M

  • 计算量:3.3 GFLOPs

  • 模型体积:2.1 MB

  • 推理速度:11.2 ms/img,89.4 FPS

4.2 与主流轻量 YOLO 对比

主流轻量模型与 PFL‑YOLO 性能对比

4.3 消融实验

四大模块协同作用,在mAP@50 保持 99.5%前提下,参数量降至 YOLOv8n 的33.4%,计算量降至40.7%,实现精度‑效率最优平衡。

4.4 可视化验证

  • 热力图:PFL‑YOLO 关注区域更大、聚焦更精准,正面羊脸特征捕获能力显著优于基线;
  • 预测结果:正面视角置信度达95%,复杂场景鲁棒性突出。

模型热力图对比 

模型预测结果对比

PART/5

     工程价值与应用场景   

终端部署友好:2.1 MB 超小体积,支持手机、嵌入式、边缘网关、监控摄像头部署;

养殖全场景适配:个体识别、精准饲喂、健康监测、行为分析、溯源管理;

泛化潜力:可快速迁移至牛、猪等畜禽面部识别任务。

PART/6

     结论   

本文提出的PFL‑YOLO是面向智慧畜牧的极致轻量化羊脸识别模型

  • 以 YOLOv8n 为基座,通过EHConv/RC2f/ESPPF/PFDetect四大创新实现结构优化;

  • 在保持99.5% mAP@50高精度前提下,参数量仅 1.01 M、体积 2.1 MB;

  • 完美平衡精度、计算量、部署性,为畜禽智能感知提供轻量化基准方案。

有相关需求的你可以联系我们!

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!


往期推荐 

🔗

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐