AS-YOLO:苹果果梗分割新标杆!轻量 YOLO + 全局注意力,实时精准双突破|智慧农业必备
计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。它做到了:只用 RGB 相机、超实时帧率、超高精度、超轻量部署,是目前农业果梗分割最落地的方案。超实时,适配高速分拣线✅ 苹果 + 果梗双分割,直接驱动去梗机构✅ 模型轻量,可部署 Jetson 等嵌入式设备✅ 数据集开源,可快速迁移到梨、柑橘、桃等。SSMA-YOLO:一种轻量级的
点击蓝字
关注我们
关注并星标
从此不迷路
计算机视觉研究院


公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
计算机视觉研究院专栏
Column of Computer Vision Institute
本文提出的AS-YOLO:基于 Ghost 瓶颈与全局注意力机制的增强 YOLO,专为苹果果梗实时分割设计。它做到了:只用 RGB 相机、超实时帧率、超高精度、超轻量部署,是目前农业果梗分割最落地的方案。

PART/1
行业痛点
行业痛点:果梗虽小,却是大难题
🍎 果梗分割为什么难?
- 目标极小:果梗占像素极少,常规 YOLO 容易漏检
- 易遮挡易混淆:和果面、枝叶、背景高度相似
- 速度与精度不可兼得:高精度模型太慢,轻量化模型不准
- 落地成本高:深度 / 红外 / 热成像相机太贵,产线难普及
而自动化采摘、智能分拣、自动去梗机构,必须又快又准。AS-YOLO 的出现,就是为了彻底解决这一痛点。
PART/2
模型核心
AS-YOLO 以 YOLOv8 为基础架构,做了两大关键创新:Ghost 瓶颈轻量化 + 全局注意力机制 GAM
🧩 图 1:AS-YOLO 整体网络架构

主干:轻量化 Ghost Bottleneck颈部:多尺度融合 + 全局注意力 GAM头部:苹果 + 果梗双类别分割头
1)Ghost Bottleneck:模型瘦身不减效
-

用廉价操作生成更多特征,大幅降低计算量
-
融合 SE 通道注意力 + 深度卷积 DWConv
-
残差结构保证信息不丢失
-
让模型更快、更小、更适合嵌入式部署
一句话:更小、更快、更强。
2)全局注意力机制 GAM:小目标 “放大镜”

-
同时做通道注意力 + 空间注意力
-
全局捕获上下文,强化果梗特征
-
解决 YOLO 局部感受野不足、小目标弱的问题
-
几乎不增加推理耗时
对果梗这种微小目标分割,GAM 是真正的杀手锏。
PART/3
数据集
数据集:AS-Seg 专业苹果果梗数据集
为了让实验可复现、模型更贴合真实场景,团队构建了专用数据集:AS-Seg(AppleStem-Segmentation)
🧩 图 2:三种采集环境

-
相机:Intel RealSense D405
-
场景:自然光、暗箱、旋转拍摄
-
总量:1260 张精细标注图像
-
公开开源:GitHub 可下载
🧩 图 3:数据集示例

PART/4
实验结果
实验结果:精度登顶,速度破 129FPS
实验平台:NVIDIA RTX 3070核心指标:mAP@50、mAP@50-95、FPS(实时性)
✅ AS-YOLO 核心成绩
-
整体 mAP@50:0.956
-
整体 mAP@50-95:0.782
-
推理速度:129.8 FPS(超实时)
✅ 分类别精度
- 苹果:精确率 0.999,召回率 1.0(近乎完美)
- 果梗:精确率 0.888,mAP@50-95 0.574(大幅领先 SOTA)
✅ 对比主流模型
-
速度比 YOLOv8 快 13%
-
速度比 YOLOv11 快 16%
-
果梗分割精度远超 Mask R-CNN / YOLACT / PointRend
PART/5
可视化效果
可视化效果:清晰分割,无假阳性
🧩 图 4:模型分割效果对比

肉眼可见:✅ 苹果边界精准✅ 果梗完整检出✅ 无手部 / 背景误检✅ 遮挡与复杂角度依然稳定
PART/6
消融实验
消融实验:证明两大模块真的有用
团队做了严格消融对比,结果非常清晰:
- YOLOv8 baseline:果梗较弱
- + Ghost 瓶颈:提速、提精度、降参数量
- + GAM:显著增强小目标果梗
- Ghost + GAM(AS-YOLO):性能达到最优
两个模块强强联合,1+1>2。
PART/7
产业价值
产业价值:农业自动化真正能用
AS-YOLO 不是实验室刷榜模型,它是产线级方案:✅ 仅用RGB 相机,低成本改造✅ 129FPS 超实时,适配高速分拣线✅ 苹果 + 果梗双分割,直接驱动去梗机构✅ 模型轻量,可部署 Jetson 等嵌入式设备✅ 数据集开源,可快速迁移到梨、柑橘、桃等
PART/8
局限与未来方向
当前局限
-
目前主要在苹果场景验证
-
基于 2D 图像,缺少 3D 坐标
未来规划
-
扩展到更多水果与复杂田间环境
-
融合 3D 点云,实现果梗 3D 定位
-
进一步轻量化,适配端侧实时控制
PART/9
总结
AS-YOLO 用Ghost 瓶颈轻量化 + 全局注意力精准分割,完美解决了苹果果梗分割的四大核心痛点:小目标看得清、速度够快、精度够高、部署够便宜。
它不仅是一篇优秀论文,更是智慧农业视觉落地的标杆之作。未来,自动去梗、智能分拣、采摘机器人…… 都将因这类模型真正普及。
有相关需求的你可以联系我们!


END


转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
往期推荐
🔗
更多推荐
所有评论(0)