当大家都在关注大模型和 Transformer 时,小波变换 + CNN 这个方向,正在悄悄升温。原因很简单:传统 CNN 虽然强,但在细节纹理、边缘信息和抗噪能力上仍有短板;而小波变换天生擅长提取多尺度、高频和局部突变特征。于是,越来越多研究开始把小波引入 CNN,用来提升医学影像、信号识别、故障诊断等任务的效果。某种意义上,这股热潮也说明了一件事:深度学习的下一步,不只是模型更大,而是特征利用更精细。本文精选 15 篇代表性工作,带你快速把握这一方向的关键脉络与最新趋势。

1.6G Conditioned Spatiotemporal Graph Neural Networks for Real Time Traffic Flow Prediction

图片

【创新点】

① 做了一个 U-Net 风格的双分支编码器,一支走 Haar wavelet downsampling,一支走残差卷积块;

② 用 wavelet downsampling 替代普通下采样,更好地保留边缘与结构细节;

③ 在解码器引入 Contrastive Refinement Enhancement Module (CREM),进一步增强器官/ROI 边界。

【方法】提出基于UNet结构的Wavelet Multi-scale Region-Enhanced Network (WMREN),通过编码器双分支架构(Haar小波变换与残差块协同提取特征)保留多尺度信息,解码器集成空间自适应融合模块增强感兴趣区域、对比度精细增强模块突出目标边界。  

【实验】在多个基准数据集上的实验表明,WMREN显著优于当前最先进的医学图像分割方法,其有效性及优越性得到验证,源代码已公开(https://github.com/C101812/WMREN/tree/master)。

2.A Prior-Driven Lightweight Network for Endoscopic Exposure Correction

图片

【创新点】

① 利用先验指出照度主要位于低频、结构细节主要位于高频,把问题转成更可解释的频率分工;

② 构建 wavelet-transform-based hierarchical WTNet,把核心学习能力集中在低频照度建模,同时保留高频结构;

③ 模型仅约 1.41M 参数,且在曝光校正、低照增强与下游分割任务上都做了验证,工程价值很高。

【方法】构建基于小波变换的轻量级分层网络WTNet,利用小波变换的频率分解特性,使核心学习聚焦于低频信息建模。  

【实验】基于四个数据集进行曝光校正、低光增强和下游分割三项任务实验,WTNet以仅1.41M参数量实现性能与成本更好平衡,展现出临床应用潜力。

3.Wavelet-convolutional neural network for fault prediction in coal mine seismic data

图片

【创新点】

① 将 Haar 小波滤波器组与 CNN 紧耦合,并通过跨尺度残差连接同时建模低频构造与高频断层特征;

② 相比常规 CNN,参数量更低、收敛更快,文中报告相对 VGG16 有更高效率;

③ 在煤矿地震断层预测上取得很强的实际可用性,对微小断层识别表现突出。

【方法】 提出了一种新的小波-卷积神经网络(W-CNN)及其变体(W-CNN R1、W-CNN R2和W-CNN R3),通过将离散小波变换(DWT)与卷积神经网络(CNN)结合,建立了一种空间-频率学习范式。

【实验】 在煤矿数据集上评估,W-CNN R3实现了90.0%的准确率(F1分数为90.3%),比主流CNN(LeNet-5、AlexNet、VGG16)高0.6-12.3%,具有最高的召回率(95.5%)和更快的收敛速度。该模型成功识别出32个暴露的复杂微断层中的30个(检测率为93.8%),与地质复杂区域的巷道暴露断层高度一致,显著增强了其对小型不连续性的预测能力。频率选择机制有效地抑制了噪声干扰,而优化的架构使得3D处理速度提高了数个数量级。该框架为智能地质解释提供了一个可扩展的解决方案,在矿山安全监测中具有关键应用。

4.Wavelet-CNet: Wavelet Cross Fusion and Detail Enhancement Network for RGB-Thermal Semantic Segmentation

图片

【创新点】

① 提出 Wavelet Cross Fusion Module (WCFM),把热红外分解为低频与高频,再做双模态重建与融合;

② 提出 Cross-Scale Detail Enhancement Module (CSDEM),把跨尺度热红外上下文和边缘细节注入各个融合阶段;

③ 在 MFNet 和 PST900 上验证了对边界与细节恢复的优势,说明“小波分解 + CNN 融合”对多模态分割确实有效。

【方法】 论文提出了一种名为Wavelet-CNet的RGB-T语义分割网络,其中设计了波let交叉融合模块(WCFM)和跨尺度细节增强模块(CSDEM)。WCFM通过小波变换分别从RGB和热特征中提取四种类型的低频和高频信息,并将其反馈到注意力机制中进行双模态特征重建。CSDEM则引入跨尺度上下文信息,通过热特征中的轮廓信息实现全局定位。

【实验】 Wavelet-CNet在MFNet和PST900数据集上分别实现了58.3%和85.77%的mIoU分数,而MFNet上的消融实验进一步验证了所提出的WCFM和CSDEM模块的有效性。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐