news 2026/6/10 16:02:18

即插即用系列(代码实践)| AAAI 2025 TBSN:基于Transformer的盲点网络——自监督去噪新SOTA,彻底解决注意力机制信息泄露难题

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
即插即用系列(代码实践)| AAAI 2025 TBSN:基于Transformer的盲点网络——自监督去噪新SOTA,彻底解决注意力机制信息泄露难题

论文题目:Rethinking Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising

中文题目:重新思考用于自监督图像去噪的基于Transformer的盲点网络
论文出处:arXiv 2025 (最新自监督去噪研究)
应用任务:自监督图像去噪 (Self-Supervised Image Denoising, SSID)、盲点网络 (BSN)
核心模块:Dilated G-CSA (扩张分组通道注意力), Dilated M-WSA (扩张掩码窗口注意力)

摘要
本文提取自2025年最新论文《Rethinking Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising》。针对自监督去噪任务中,主流的盲点网络(Blind-Spot Network, BSN)长期被 CNN 统治,而强大的 Transformer 因Attention 机制容易泄露中心像素(Blind-Spot)信息而无法应用的痛点,复现了其核心组件——TBSN(Transformer-based BSN)。该模块通过重新设计通道注意力和空间注意力,在保留 Transformer 强大建模能力的同时,严格遵守盲点约束,是无参考图像去噪领域的重大突破。


目录

    • 第一部分:模块原理与实战分析
      • 1. 论文背景与解决的痛点
      • 2. 核心模块原理揭秘
      • 3. 架构图解
      • 4. 适用场景与魔改建议
    • 第二部分:核心完整代码
    • 第三部分:结果验证与总结

第一部分:模块原理与实战分析

1. 论文背景与解决的痛点

在没有干净参考图(Ground Truth)的情况下进行图像去噪(即自监督去噪),通常采用盲点网络(BSN)。它的核心逻辑是:利用周围的像素预测中心像素,因为噪声通常是独立的,而图像信号是相关的。

然而,现有的 BSN 几乎全是用 CNN(特别是扩张卷积)做的,因为卷积很容易设计成“不看中心点”。Transformer 虽然在图像复原(如 Restormer)中效果拔群,但想用在 BSN 里却有两个致命缺陷:

  1. 通道注意力的泄露:在多尺度架构中,下采样操作会将空间信息混入通道维度,导致计算通道注意力时“偷看”到了中心像素。
  2. 空间注意力的泄露:标准的 Self-Attention 计算全局或窗口相关性时,Query 会不可避免地和自身的 Key/Value 交互,直接破坏了盲点假设。

痛点总结:我们需要一种既有 Transformer 的长距离建模能力,又能像扩张卷积一样严格屏蔽中心像素的注意力机制。

2. 核心模块原理揭秘

为了解决“既要 Transformer 强,又要 BSN 盲”的矛盾,TBSN 提出了两个核心魔改模块。我已将其封装为即插即用的 PyTorch 类:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 10:40:23

垃圾处理器真实体验测评:5款热门机型使用体验全解析

垃圾处理器真实体验测评:5款热门机型使用体验全解析作为一个家电测评作者,我测试过超过20款垃圾处理器,而我自己的家庭使用垃圾处理器也已经超过5年。今天,我不谈枯燥的参数,只想和你分享真实的使用体验:垃…

作者头像 李华
网站建设 2026/6/10 10:44:44

ros2 run 配置参数

在ROS2中&#xff0c;通过ros2 run配置节点参数主要涉及命令行参数传递、参数文件和Launch文件集成三种方式。以下以ROS2 Jazzy为例详细说明&#xff1a; 1️⃣ 命令行直接传递参数 ros2 run <package_name> <executable_name> \--ros-args \-p <parameter_name…

作者头像 李华
网站建设 2026/6/9 13:39:49

SSM299的球鞋商品竞拍卖网站vue

目录SSM299球鞋竞拍卖网站Vue摘要开发技术源码文档获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;SSM299球鞋竞拍卖网站Vue摘要 该平台基于Vue.js前端框架与SSM&#xff08;SpringSpringMVCMyBatis&#xff09;后端架构开发&#xff0c;专注于…

作者头像 李华
网站建设 2026/6/10 1:21:33

光束驱动AI计算实现超级计算机级性能

张量运算是一种支撑现代技术特别是人工智能的高级数学形式。这些运算远超人们日常遇到的简单计算。可以将其想象为同时在多个维度操控魔方&#xff0c;通过旋转、切片或重新排列各个层面。人类和传统计算机必须将这些任务分解为序列&#xff0c;但光可以同时执行所有操作。如今…

作者头像 李华
网站建设 2026/6/9 22:21:00

从iPhone 13 Pro Max升级到iPhone 17 Pro Max的5大感受

在朋友圈中以节俭著称&#xff0c;加上生活在iPhone价格全球最高的国家之一&#xff0c;这解释了我为什么使用iPhone 13 Pro Max这么长时间。但在假期期间&#xff0c;在纽约的一次快速旅行中&#xff0c;我终于下定决心进行了升级。我把这归咎于等待Apple Vision Pro演示时的闲…

作者头像 李华