从“黑箱卷积”到“频域开挂”：小波+CNN为什么突然又火了？

【摘要】小波变换与CNN融合的研究方向正受到关注，通过结合小波的多尺度特征提取能力与CNN的深度学习优势，提升图像处理任务性能。代表性工作包括：1) WMREN网络通过小波下采样保留边缘细节，在医学图像分割中表现优异；2) WTNet利用小波频率分解特性实现轻量级曝光校正；3) W-CNN在小波变换基础上构建空间-频率学习范式，显著提升煤矿断层预测准确率；4) Wavelet-CNet通过小波交叉

2501_94342146

363人浏览 · 2026-04-03 11:39:01

2501_94342146 · 2026-04-03 11:39:01 发布

当大家都在关注大模型和 Transformer 时，小波变换 + CNN 这个方向，正在悄悄升温。原因很简单：传统 CNN 虽然强，但在细节纹理、边缘信息和抗噪能力上仍有短板；而小波变换天生擅长提取多尺度、高频和局部突变特征。于是，越来越多研究开始把小波引入 CNN，用来提升医学影像、信号识别、故障诊断等任务的效果。某种意义上，这股热潮也说明了一件事：深度学习的下一步，不只是模型更大，而是特征利用更精细。本文精选 15 篇代表性工作，带你快速把握这一方向的关键脉络与最新趋势。

1.6G Conditioned Spatiotemporal Graph Neural Networks for Real Time Traffic Flow Prediction

【创新点】

① 做了一个 U-Net 风格的双分支编码器，一支走 Haar wavelet downsampling，一支走残差卷积块；

② 用 wavelet downsampling 替代普通下采样，更好地保留边缘与结构细节；

③ 在解码器引入 Contrastive Refinement Enhancement Module (CREM)，进一步增强器官/ROI 边界。

【方法】提出基于UNet结构的Wavelet Multi-scale Region-Enhanced Network (WMREN)，通过编码器双分支架构（Haar小波变换与残差块协同提取特征）保留多尺度信息，解码器集成空间自适应融合模块增强感兴趣区域、对比度精细增强模块突出目标边界。

【实验】在多个基准数据集上的实验表明，WMREN显著优于当前最先进的医学图像分割方法，其有效性及优越性得到验证，源代码已公开（https://github.com/C101812/WMREN/tree/master）。

2.A Prior-Driven Lightweight Network for Endoscopic Exposure Correction

【创新点】

① 利用先验指出照度主要位于低频、结构细节主要位于高频，把问题转成更可解释的频率分工；

② 构建 wavelet-transform-based hierarchical WTNet，把核心学习能力集中在低频照度建模，同时保留高频结构；

③ 模型仅约 1.41M 参数，且在曝光校正、低照增强与下游分割任务上都做了验证，工程价值很高。

【方法】构建基于小波变换的轻量级分层网络WTNet，利用小波变换的频率分解特性，使核心学习聚焦于低频信息建模。

【实验】基于四个数据集进行曝光校正、低光增强和下游分割三项任务实验，WTNet以仅1.41M参数量实现性能与成本更好平衡，展现出临床应用潜力。

3.Wavelet-convolutional neural network for fault prediction in coal mine seismic data

【创新点】

① 将 Haar 小波滤波器组与 CNN 紧耦合，并通过跨尺度残差连接同时建模低频构造与高频断层特征；

② 相比常规 CNN，参数量更低、收敛更快，文中报告相对 VGG16 有更高效率；

③ 在煤矿地震断层预测上取得很强的实际可用性，对微小断层识别表现突出。

【方法】提出了一种新的小波-卷积神经网络（W-CNN）及其变体（W-CNN R1、W-CNN R2和W-CNN R3），通过将离散小波变换（DWT）与卷积神经网络（CNN）结合，建立了一种空间-频率学习范式。

【实验】在煤矿数据集上评估，W-CNN R3实现了90.0%的准确率（F1分数为90.3%），比主流CNN（LeNet-5、AlexNet、VGG16）高0.6-12.3%，具有最高的召回率（95.5%）和更快的收敛速度。该模型成功识别出32个暴露的复杂微断层中的30个（检测率为93.8%），与地质复杂区域的巷道暴露断层高度一致，显著增强了其对小型不连续性的预测能力。频率选择机制有效地抑制了噪声干扰，而优化的架构使得3D处理速度提高了数个数量级。该框架为智能地质解释提供了一个可扩展的解决方案，在矿山安全监测中具有关键应用。

4.Wavelet-CNet: Wavelet Cross Fusion and Detail Enhancement Network for RGB-Thermal Semantic Segmentation

【创新点】

① 提出 Wavelet Cross Fusion Module (WCFM)，把热红外分解为低频与高频，再做双模态重建与融合；

② 提出 Cross-Scale Detail Enhancement Module (CSDEM)，把跨尺度热红外上下文和边缘细节注入各个融合阶段；

③ 在 MFNet 和 PST900 上验证了对边界与细节恢复的优势，说明“小波分解 + CNN 融合”对多模态分割确实有效。

【方法】论文提出了一种名为Wavelet-CNet的RGB-T语义分割网络，其中设计了波let交叉融合模块（WCFM）和跨尺度细节增强模块（CSDEM）。WCFM通过小波变换分别从RGB和热特征中提取四种类型的低频和高频信息，并将其反馈到注意力机制中进行双模态特征重建。CSDEM则引入跨尺度上下文信息，通过热特征中的轮廓信息实现全局定位。

【实验】 Wavelet-CNet在MFNet和PST900数据集上分别实现了58.3%和85.77%的mIoU分数，而MFNet上的消融实验进一步验证了所提出的WCFM和CSDEM模块的有效性。

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git