Transformer+UNet,发文的不二选择!思路设计得好,顶会没烦恼
------正文开始--------近两年已经成为图像分割、生成等任务的标配架构。顶会和相关顶刊持续接收该方向的创新工作。就发文情况来看,这对组合虽然火了好久,确实竞争激烈,但在轻量化、跨模态适应、3D/视频扩展、可解释性等细分方向还是有不少创新空间的。如果能在特定应用场景中解决现有局限(数据稀缺、模型效率这类),也很容易产出论文。讲更具体点,比如眼科OCT分割、病理切片分析等数据特征鲜明的垂直领
-------正文开始--------
Transformer与UNet的结合在近两年已经成为图像分割、生成等任务的标配架构。顶会和相关顶刊持续接收该方向的创新工作。
就发文情况来看,这对组合虽然火了好久,确实竞争激烈,但在轻量化、跨模态适应、3D/视频扩展、可解释性等细分方向还是有不少创新空间的。如果能在特定应用场景中解决现有局限(数据稀缺、模型效率这类),也很容易产出论文。
讲更具体点,比如眼科OCT分割、病理切片分析等数据特征鲜明的垂直领域就是好选择,能凸显方法的针对性。如果你感兴趣,可以先从近期的成果入手!
有论文需求的小伙伴
扫码咨询

TSUBF-Net: Trans-Spatial UNet-like Network with Bi-direction Fusion for Segmentation of Adenoid Hypertrophy in CT
方法:论文提出 TSUBF-Net,一种基于 U 型架构的 3D 医学图像分割框架,融合 Transformer 相关机制与 UNet 结构,通过设计TSP模块增强空间感知能力、BSCF模块优化特征融合,并引入 Sobel 损失项提升分割平滑度与准确性,专门用于解决 CT 图像中腺样体肥大分割边界模糊的问题

创新点:
-
提出基于U型架构的3D分割框架TSUBF-Net,针对性解决CT图像中腺样体肥大的3D分割研究空白。
-
设计TSP模块和BSCF模块,分别强化模型空间感知能力、优化上下采样特征融合,提升分割效果。
-
引入Sobel损失项,结合3D Sobel算子优化损失函数,同时提升分割准确性与结果平滑度。

AgileFormer: Spatially Agile Transformer UNet for Medical Image Segmentation
方法:论文提出 AgileFormer,一种基于 Transformer+UNet 架构的纯 ViT-UNet 模型,通过引入可变形补丁嵌入、空间动态自注意力(交替邻域多头注意力与可变形多头注意力)及多尺度可变形位置编码,捕捉不同外观目标的特征,适配 2D 和 3D 医学图像分割任务。

创新点:
-
用可变形补丁嵌入替代刚性方形补丁嵌入,适配不同尺寸和形状的目标,弥补自注意力机制在局部特征捕捉上的不足。
-
设计空间动态自注意力模块,交替邻域多头注意力与可变形多头注意力,兼顾局部信息与空间适应性。
-
提出多尺度可变形位置编码,适配不规则采样网格,有效建模 2D/3D 信号的空间相关性,提升模型对异质目标的特征捕捉能力。

HMT-UNet: A hybird Mamba-Transformer Vision UNet for Medical Image Segmentation
方法:论文提出 HMT-UNet,首次将 SSM 与 Transformer 的纯混合模型应用于医学图像分割,采用 U 形架构,编码器含 MambaVision 的卷积模块与 VSSM 和 Transformer 混合的 MambaVision Mixer 并下采样,解码器整合 MambaVision Mixer、上采样等操作,通过简单加法实现跳跃连接,结合交叉熵和 Dice 损失函数完成分割任务。

创新点:
-
首次将SSM与Transformer的纯混合模型应用于医学图像分割,提出HMT-UNet架构。
-
在多个公共和私有医学图像数据集上开展全面实验,验证了模型的竞争力。
-
为医学图像分割领域的SSM与Transformer混合模型建立基准,为后续相关高效分割方法的研发提供参考。
-

方法:论文构建含 711 张 224×224 像素带裂缝标签的数据集,选用 0.5BCE+Dice 损失函数,对 TransUNet、SwinUNet、MTUNet 三种 Transformer 与 UNet 结合的模型,及五种典型 CNN 模型进行训练与评估,通过 IoU、准确率等指标,从精度、计算复杂度和稳定性分析各模型在路面裂缝检测中的性能。

创新点:
-
构建含711张224×224像素的路面裂缝数据集,涵盖多种裂缝类型及阴影、油污等实际干扰因素。
-
将TransUNet、SwinUNet、MTUNet三种Transformer与UNet结合的模型,应用于路面裂缝检测并与五种CNN模型对比。
-
筛选出0.5BCE+Dice最优损失函数,从精度、计算复杂度、稳定性多维度评估,确定SwinUNet为综合性能最优模型。

感谢各位观众的观看和支持,祝大家的论文早日accept!!
希望论文一路绿灯的朋友可以找我,我有团队,有资源,有背景,一条龙服务~~~~


更多推荐
所有评论(0)