——CVPR 2026 前沿解读:高频引导低频、结构纹理双保真的新一代注意力范式
一、引言:为什么我们需要在频率域思考注意力?
在计算机视觉领域,注意力机制已经成为深度神经网络不可或缺的组成模块。从SENet的通道压缩激励,到CBAM的通道-空间联合注意,再到Vision Transformer中的自注意力,研究者们不断探索如何让网络“知道该看哪里”。然而,一个根本性问题始终悬而未决:传统注意力机制对所有频率成分“一视同仁”,往往导致高频细节被过度平滑、低频结构建模计算量过大。
根据中山大学空天智能无人系统团队2026年4月在《Aerospace Science and Technology》发表的研究成果,突破传统通道注意力仅加权融合的局限,采用自适应哈尔小波变换对特征做多尺度频域分解,是解决上述问题的关键路径。与此同时,B站上一则关于“小波变换+注意力机制”的技术视频也指出,这一组合正悄然成为信号感知与特征建模交叉领域的“隐形加速器”——它不靠堆叠参数取胜,而是以多分辨率分析能力弥补注意力对局部细节的忽视。
在精细分类任务中,这一痛点尤为突出。以遥感图像中舰船识别为例,不同型号舰船之间的差异往往仅体现在局部结构轮廓和细微纹理上,而这些关键特征恰恰分布于高频子带。FALB论文中指出,标准CNN瓶颈层倾向于过拟合高频纹理线索(如船体轮廓),却对全局结构信息(如船体整体分布)建模不足。
在这样的背景下,WaveBlock——一种将小波变换(Wavelet Tr