点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式

计算机视觉研究院专栏

Column of Computer Vision Institute

本文提出的AS-YOLO:基于 Ghost 瓶颈与全局注意力机制的增强 YOLO,专为苹果果梗实时分割设计。它做到了:只用 RGB 相机、超实时帧率、超高精度、超轻量部署,是目前农业果梗分割最落地的方案。

PART/1

    行业痛点   

 行业痛点:果梗虽小,却是大难题

🍎 果梗分割为什么难?

  1. 目标极小:果梗占像素极少,常规 YOLO 容易漏检
  2. 易遮挡易混淆:和果面、枝叶、背景高度相似
  3. 速度与精度不可兼得:高精度模型太慢,轻量化模型不准
  4. 落地成本高:深度 / 红外 / 热成像相机太贵,产线难普及

而自动化采摘、智能分拣、自动去梗机构,必须又快又准。AS-YOLO 的出现,就是为了彻底解决这一痛点。

PART/2

     模型核心   

AS-YOLO 以 YOLOv8 为基础架构,做了两大关键创新:Ghost 瓶颈轻量化 + 全局注意力机制 GAM

🧩 图 1:AS-YOLO 整体网络架构

主干:轻量化 Ghost Bottleneck颈部:多尺度融合 + 全局注意力 GAM头部:苹果 + 果梗双类别分割头


1)Ghost Bottleneck:模型瘦身不减效

  • 用廉价操作生成更多特征,大幅降低计算量

  • 融合 SE 通道注意力 + 深度卷积 DWConv

  • 残差结构保证信息不丢失

  • 让模型更快、更小、更适合嵌入式部署

一句话:更小、更快、更强。


2)全局注意力机制 GAM:小目标 “放大镜”

  • 同时做通道注意力 + 空间注意力

  • 全局捕获上下文,强化果梗特征

  • 解决 YOLO 局部感受野不足、小目标弱的问题

  • 几乎不增加推理耗时

对果梗这种微小目标分割,GAM 是真正的杀手锏

PART/3

     数据集   

数据集:AS-Seg 专业苹果果梗数据集

为了让实验可复现、模型更贴合真实场景,团队构建了专用数据集:AS-Seg(AppleStem-Segmentation)

🧩 图 2:三种采集环境

  • 相机:Intel RealSense D405

  • 场景:自然光、暗箱、旋转拍摄

  • 总量:1260 张精细标注图像

  • 公开开源:GitHub 可下载

🧩 图 3:数据集示例

PART/4

     实验结果   

 实验结果:精度登顶,速度破 129FPS

实验平台:NVIDIA RTX 3070核心指标:mAP@50、mAP@50-95、FPS(实时性)

✅ AS-YOLO 核心成绩

  • 整体 mAP@50:0.956

  • 整体 mAP@50-95:0.782

  • 推理速度:129.8 FPS(超实时)

✅ 分类别精度

  • 苹果:精确率 0.999,召回率 1.0(近乎完美)
  • 果梗:精确率 0.888,mAP@50-95 0.574(大幅领先 SOTA)

✅ 对比主流模型

  • 速度比 YOLOv8 快 13%

  • 速度比 YOLOv11 快 16%

  • 果梗分割精度远超 Mask R-CNN / YOLACT / PointRend

PART/5

     可视化效果   

可视化效果:清晰分割,无假阳性

🧩 图 4:模型分割效果对比

肉眼可见:✅ 苹果边界精准✅ 果梗完整检出✅ 无手部 / 背景误检✅ 遮挡与复杂角度依然稳定

PART/6

     消融实验   

消融实验:证明两大模块真的有用

团队做了严格消融对比,结果非常清晰:

  1. YOLOv8 baseline:果梗较弱
  2. + Ghost 瓶颈:提速、提精度、降参数量
  3. + GAM:显著增强小目标果梗
  4. Ghost + GAM(AS-YOLO):性能达到最优

两个模块强强联合,1+1>2。

PART/7

     产业价值   

产业价值:农业自动化真正能用

AS-YOLO 不是实验室刷榜模型,它是产线级方案:✅ 仅用RGB 相机,低成本改造✅ 129FPS 超实时,适配高速分拣线✅ 苹果 + 果梗双分割,直接驱动去梗机构✅ 模型轻量,可部署 Jetson 等嵌入式设备✅ 数据集开源,可快速迁移到梨、柑橘、桃等

PART/8

     局限与未来方向   

当前局限

  • 目前主要在苹果场景验证

  • 基于 2D 图像,缺少 3D 坐标

未来规划

  • 扩展到更多水果与复杂田间环境

  • 融合 3D 点云,实现果梗 3D 定位

  • 进一步轻量化,适配端侧实时控制

PART/9

     总结   

AS-YOLO 用Ghost 瓶颈轻量化 + 全局注意力精准分割,完美解决了苹果果梗分割的四大核心痛点:小目标看得清、速度够快、精度够高、部署够便宜。

它不仅是一篇优秀论文,更是智慧农业视觉落地的标杆之作。未来,自动去梗、智能分拣、采摘机器人…… 都将因这类模型真正普及。

有相关需求的你可以联系我们!

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!


往期推荐 

🔗

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐