AS-YOLO：苹果果梗分割新标杆！轻量 YOLO + 全局注意力，实时精准双突破｜智慧农业必备

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。它做到了：只用 RGB 相机、超实时帧率、超高精度、超轻量部署，是目前农业果梗分割最落地的方案。超实时，适配高速分拣线✅ 苹果 + 果梗双分割，直接驱动去梗机构✅ 模型轻量，可部署 Jetson 等嵌入式设备✅ 数据集开源，可快速迁移到梨、柑橘、桃等。SSMA-YOLO：一种轻量级的

计算机视觉研究院

581人浏览 · 2026-04-05 18:18:25

计算机视觉研究院 · 2026-04-05 18:18:25 发布

点击蓝字

关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜计算机视觉研究院

学习群｜扫码在主页获取加入方式

计算机视觉研究院专栏

Column of Computer Vision Institute

本文提出的AS-YOLO：基于 Ghost 瓶颈与全局注意力机制的增强 YOLO，专为苹果果梗实时分割设计。它做到了：只用 RGB 相机、超实时帧率、超高精度、超轻量部署，是目前农业果梗分割最落地的方案。

PART/1

行业痛点

行业痛点：果梗虽小，却是大难题

🍎 果梗分割为什么难？

目标极小：果梗占像素极少，常规 YOLO 容易漏检
易遮挡易混淆：和果面、枝叶、背景高度相似
速度与精度不可兼得：高精度模型太慢，轻量化模型不准
落地成本高：深度 / 红外 / 热成像相机太贵，产线难普及

而自动化采摘、智能分拣、自动去梗机构，必须又快又准。AS-YOLO 的出现，就是为了彻底解决这一痛点。

PART/2

模型核心

AS-YOLO 以 YOLOv8 为基础架构，做了两大关键创新：Ghost 瓶颈轻量化 + 全局注意力机制 GAM

🧩 图 1：AS-YOLO 整体网络架构

主干：轻量化 Ghost Bottleneck颈部：多尺度融合 + 全局注意力 GAM头部：苹果 + 果梗双类别分割头

1）Ghost Bottleneck：模型瘦身不减效

用廉价操作生成更多特征，大幅降低计算量
融合 SE 通道注意力 + 深度卷积 DWConv
残差结构保证信息不丢失
让模型更快、更小、更适合嵌入式部署

一句话：更小、更快、更强。

2）全局注意力机制 GAM：小目标 “放大镜”

同时做通道注意力 + 空间注意力
全局捕获上下文，强化果梗特征
解决 YOLO 局部感受野不足、小目标弱的问题
几乎不增加推理耗时

对果梗这种微小目标分割，GAM 是真正的杀手锏。

PART/3

数据集

数据集：AS-Seg 专业苹果果梗数据集

为了让实验可复现、模型更贴合真实场景，团队构建了专用数据集：AS-Seg（AppleStem-Segmentation）

🧩 图 2：三种采集环境

相机：Intel RealSense D405
场景：自然光、暗箱、旋转拍摄
总量：1260 张精细标注图像
公开开源：GitHub 可下载

🧩 图 3：数据集示例

PART/4

实验结果

实验结果：精度登顶，速度破 129FPS

实验平台：NVIDIA RTX 3070核心指标：mAP@50、mAP@50-95、FPS（实时性）

✅ AS-YOLO 核心成绩

整体 mAP@50：0.956
整体 mAP@50-95：0.782
推理速度：129.8 FPS（超实时）

✅ 分类别精度

苹果：精确率 0.999，召回率 1.0（近乎完美）
果梗：精确率 0.888，mAP@50-95 0.574（大幅领先 SOTA）

✅ 对比主流模型

速度比 YOLOv8 快 13%
速度比 YOLOv11 快 16%
果梗分割精度远超 Mask R-CNN / YOLACT / PointRend

PART/5

可视化效果

可视化效果：清晰分割，无假阳性

🧩 图 4：模型分割效果对比

肉眼可见：✅ 苹果边界精准✅ 果梗完整检出✅ 无手部 / 背景误检✅ 遮挡与复杂角度依然稳定

PART/6

消融实验

消融实验：证明两大模块真的有用

团队做了严格消融对比，结果非常清晰：

YOLOv8 baseline：果梗较弱
+ Ghost 瓶颈：提速、提精度、降参数量
+ GAM：显著增强小目标果梗
Ghost + GAM（AS-YOLO）：性能达到最优

两个模块强强联合，1+1>2。

PART/7

产业价值

产业价值：农业自动化真正能用

AS-YOLO 不是实验室刷榜模型，它是产线级方案：✅ 仅用RGB 相机，低成本改造✅ 129FPS 超实时，适配高速分拣线✅ 苹果 + 果梗双分割，直接驱动去梗机构✅ 模型轻量，可部署 Jetson 等嵌入式设备✅ 数据集开源，可快速迁移到梨、柑橘、桃等

PART/8

局限与未来方向

当前局限

目前主要在苹果场景验证
基于 2D 图像，缺少 3D 坐标

未来规划

扩展到更多水果与复杂田间环境
融合 3D 点云，实现果梗 3D 定位
进一步轻量化，适配端侧实时控制

PART/9

总结

AS-YOLO 用Ghost 瓶颈轻量化 + 全局注意力精准分割，完美解决了苹果果梗分割的四大核心痛点：小目标看得清、速度够快、精度够高、部署够便宜。

它不仅是一篇优秀论文，更是智慧农业视觉落地的标杆之作。未来，自动去梗、智能分拣、采摘机器人…… 都将因这类模型真正普及。

有相关需求的你可以联系我们！

END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

往期推荐

🔗

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git