news 2026/4/18 11:49:19

TPAMI 2025 | 顶刊突破!Pixel2Pixel:仅用噪声图构建像素库,零样本去噪轻松应对真实噪声场景

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
TPAMI 2025 | 顶刊突破!Pixel2Pixel:仅用噪声图构建像素库,零样本去噪轻松应对真实噪声场景
点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达

在计算机视觉领域,图像去噪技术始终是底层视觉任务的核心研究方向。传统监督学习方法依赖海量噪声-干净图像对,泛化能力受限;现有零样本方法虽摆脱对干净数据的依赖,却因忽视真实噪声的空间相关性而性能不佳。2025年TPAMI期刊收录的论文《Pixel2Pixel: A Pixelwise Approach for Zero-Shot Single Image Denoising》提出了一种创新性逐像素解决方案,通过构建非局部像素库与随机采样策略,实现了各类噪声场景下的高质量去噪。本文将系统解析这一方法的技术突破与实验验证。

论文信息

题目:Pixel2Pixel: A Pixelwise Approach for Zero-Shot Single Image Denoising
像素对像素:一种用于零样本单图像去噪的逐像素方法
作者:Qing Ma, Junjun Jiang, Xiong Zhou, Pengwei Liang, Xianming Liu, Jiayi Ma

研究背景:零样本去噪的核心挑战

基于深度学习的去噪方法已取得显著进展,但仍面临两大关键瓶颈:

  1. 数据依赖困境:监督方法(如DnCNN)需大量匹配的噪声-干净图像对,采集成本极高;自监督方法虽无需干净数据,但仍依赖多幅同场景噪声图像。

  2. 噪声模型局限:现有零样本方法(如ZS-N2N、Self2Self)假设噪声独立同分布,而真实世界噪声(如相机传感器噪声、显微镜噪声)存在显著空间相关性,导致这些方法性能骤降。

如图1所示,传统方法在处理高噪声图像时,要么残留大量噪声,要么过度平滑细节。其根本原因在于:这些方法仅利用局部图像相似性构建训练样本(如2×2区域内采样),无法打破噪声的空间关联性(图2)。

图1:不同去噪方法在真实噪声图像上的效果对比,Pixel2Pixel在细节保留与噪声抑制间实现更优平衡

图2:各类方法采样策略差异示意图,Pixel2Pixel通过非局部采样打破噪声空间相关性

方法创新: Pixel2Pixel的技术框架

Pixel2Pixel的核心突破在于:基于图像非局部自相似性(NSS)构建像素级训练样本,通过统计特性适配的损失函数,实现零样本场景下的鲁棒去噪。其技术框架包含三个关键模块:

1. 非局部像素库构建

自然图像中普遍存在重复模式(如纹理、结构),这一特性被Pixel2Pixel转化为核心优势。对于输入噪声图像中的每个像素,算法执行以下操作:

  • 提取该像素周围7×7大小的局部块作为模板

  • 在40×40的大窗口内搜索最相似的M个非局部块(M根据噪声类型设为10-50)

  • 提取这些相似块的中心像素,构建维度为h×w×c×M的像素库张量(图3)

这种设计使每个像素能关联全局范围内的相似像素,即使局部信息被噪声破坏,仍可通过非局部像素恢复内容。

图3:像素库构建过程示意图,每个像素关联多个非局部相似像素

2. 逐像素随机采样策略

为生成有效训练样本,Pixel2Pixel提出创新性采样机制:

  • 从每个像素的库中随机选择两个不同像素,组成“伪实例对”

  • 采样过程打破原始空间排列,使生成样本的噪声相关性显著降低(图4)

  • 理论上可生成M²×h×w个样本,远超传统方法的样本量

对比ZS-N2N的固定对角线采样,该策略生成的样本噪声相关性降低60%以上,更符合独立噪声假设,有效提升网络泛化能力。

图4:噪声相关性分析,Pixel2Pixel采样后噪声空间相关性显著降低

3. 适配噪声特性的网络训练

网络采用5层轻量CNN架构(每层64个3×3卷积+LeakyReLU),关键设计包括:

  • 动态输入机制:每次迭代随机选取伪实例对作为输入-目标,而非固定噪声图

  • 损失函数自适应:零均值噪声(高斯、泊松)用L2损失,非零均值噪声(椒盐、脉冲)用L1损失

  • 无残差连接设计:实验证明残差结构会降低零样本场景下的稳定性

图5:Pixel2Pixel总体框架图,从像素库构建到网络训练的完整流程

实验验证:跨场景的性能超越

研究团队在四类噪声场景中进行了全面验证,对比12种主流方法(包括BM3D、Self2Self、ZS-N2N等),结果显示Pixel2Pixel在定量指标与视觉效果上均显著领先。

1. 合成噪声去噪

在高斯噪声(σ=10/25/50)和泊松噪声(λ=10/25/50)测试中:

  • 定量指标:在Kodak24数据集上,σ=50时PSNR达28.76dB,较ZS-N2N提升1.8dB,较Self2Self提升0.9dB

  • 视觉效果:有效抑制噪声的同时保留纹理细节,避免Self2Self的过度平滑问题(图6)

图6:高斯噪声(σ=50)去噪结果对比,Pixel2Pixel细节保留更优

2. 非零均值噪声去噪

针对椒盐噪声(p=0.2/0.3)和脉冲噪声,Pixel2Pixel表现尤为突出:

  • 在McMaster18数据集上,椒盐噪声去噪PSNR达26.31dB,远超ZS-N2N(22.15dB)

  • 解决了传统方法对非零均值噪声处理失效的问题,如图7所示,有效去除极端噪声点

图7:椒盐噪声去噪结果,Pixel2Pixel完全去除噪声点且保留结构

3. 真实场景噪声去噪

在两类真实数据集上的突破最为显著:

  • 相机噪声(SIDD数据集):平均PSNR达39.24dB,较专门设计的MASH方法提升0.8dB,处理低光图像时优势更明显(图8)

  • 显微镜噪声(FMD数据集):在Photon BPAE类别上PSNR达32.17dB,较次优方法提升1.5dB,清晰保留细胞边缘细节(图9)

图8:真实相机噪声去噪对比,Pixel2Pixel有效抑制噪声且保持色彩真实性

图9:显微镜图像去噪结果,Pixel2Pixel助力生物结构清晰化

消融实验:关键设计的有效性验证

为揭示各模块贡献,研究进行了系统消融实验:

  • 采样策略:逐像素随机采样较逐图像采样PSNR提升0.7dB,证明像素级随机性的重要性

  • 网络层数:5层网络在性能与效率间最优,更深网络(8层)仍保持稳定,而ZS-N2N在层数增加时性能骤降

  • 参数敏感性:块大小k=7、窗口W=40时性能最佳,验证了参数选择的合理性

这些结果表明,Pixel2Pixel的每个设计都经过实证优化,形成有机整体。

总结与展望

Pixel2Pixel通过挖掘图像非局部自相似性,构建像素级训练样本,首次在理论与实践上解决了零样本去噪中噪声空间相关性的难题。其创新点可概括为:

  1. 理论上证明Noise2Noise框架下全局极小值的微观统计特性

  2. 提出非局部像素库与随机采样结合的样本生成机制

  3. 实现对零均值、非零均值及真实噪声的统一处理

该方法为低资源场景下的图像恢复提供了新思路,未来可拓展至超分辨率、去模糊等其他底层视觉任务,具有重要的学术与应用价值。

下载1:OpenCV-Contrib扩展模块中文版教程 在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。 下载2:Python视觉实战项目52讲 在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。 下载3:人工智能0基础学习攻略手册 在「小白学视觉」公众号后台回复:攻略手册,即可获取《从 0 入门人工智能学习攻略手册》文档,包含视频课件、习题、电子书、代码、数据等人工智能学习相关资源,可以下载离线学习。 交流群 欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 8:34:39

11、摄影合成与修复:解锁照片无限可能

摄影合成与修复:解锁照片无限可能 摄影合成基础 摄影合成,简而言之,就是将多个独立的图像组合成一个新图像。通过运用分层、不透明度、混合模式、蒙版、渐变以及选择工具等技术,能创造出各种令人惊叹的效果。 使用选择工具进行合成 准备 sunset.jpg 和 skull.jpg 两…

作者头像 李华
网站建设 2026/4/18 1:58:40

AI智能绘图完全实战:三步掌握专业图表制作技巧

还在为复杂的图表制作而头疼吗?传统的绘图工具需要你手动拖拽每个元素、调整每条连接线,耗费大量时间却效果不佳。现在,通过Next AI Draw.io的智能绘图能力,你只需用自然语言描述需求,就能快速生成专业级图表&#xff…

作者头像 李华
网站建设 2026/4/17 23:44:48

Pydantic AI环境变量配置的3个实战技巧与调试方法

Pydantic AI环境变量配置的3个实战技巧与调试方法 【免费下载链接】pydantic-ai Agent Framework / shim to use Pydantic with LLMs 项目地址: https://gitcode.com/GitHub_Trending/py/pydantic-ai 在构建基于Pydantic AI的智能应用时,环境变量的正确配置往…

作者头像 李华
网站建设 2026/4/18 1:59:35

博物馆|基于java + vue博物馆展览与服务一体化系统(源码+数据库+文档)

目录 基于springboot vue博物馆展览与服务一体化系统 一、前言 二、系统功能演示 三、技术选型 四、其他项目参考 五、代码参考 六、测试参考 七、最新计算机毕设选题推荐 八、源码获取: 基于springboot vue博物馆展览与服务一体化系统 一、前言 博主介绍…

作者头像 李华
网站建设 2026/4/18 1:59:44

终极指南:零基础掌握clipboard.js前端复制方案

还在为用户需要手动复制网页内容而烦恼吗?传统的复制流程不仅繁琐,还容易出错。今天,我将带你手把手掌握clipboard.js这个仅3KB的轻量级前端复制工具,让你彻底告别复杂的数据复制难题!🎯 【免费下载链接】c…

作者头像 李华
网站建设 2026/4/18 2:01:09

Qwen3-VL-8B-Instruct-GGUF终极指南:边缘AI多模态模型完整解析

Qwen3-VL-8B-Instruct-GGUF作为当前最先进的轻量化多模态模型,正在重新定义边缘设备上AI应用的边界。该模型通过GGUF格式的巧妙设计,将语言模型与视觉编码器分离部署,为开发者提供了前所未有的灵活性和效率。🚀 【免费下载链接】Q…

作者头像 李华