news 2026/4/18 4:13:15

【北理工-AAAI26】Earth-Adapter:专治卫星图像分割的“干扰顽疾”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【北理工-AAAI26】Earth-Adapter:专治卫星图像分割的“干扰顽疾”

文章:Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation

代码:https://github.com/VisionXLab/Earth-Adapter

单位:北京理工大学


一、问题背景:视觉AI在遥感领域的“水土不服”

近年来,CLIP、DINOv2等视觉基础模型(VFMs)凭借海量数据预训练,在普通图像任务中表现惊艳。为了让这些大模型快速适配下游任务,参数高效微调(PEFT)方法(如LoRA、VPT)成为主流,既能保留模型原有能力,又能减少计算成本。

但当这些方法应用到遥感图像分割时,却出现了严重的“性能滑坡”:

  • 遥感图像没有明确主体,农田、建筑、道路等多尺度目标混杂,且采用俯视视角,导致“干扰信息”(学术上称为“伪影”)遍布全图;

  • 普通图像的干扰仅围绕前景物体(如人、动物),影响有限,而遥感图像的干扰会严重破坏像素级特征提取,让分割结果漏洞百出;

  • 现有PEFT方法专为自然语言或普通图像设计,无法应对遥感图像的特殊干扰,甚至会越调越差。

二、方法创新:“分而治之”的Earth-Adapter

针对上述痛点,研究团队推出了首个专为遥感图像设计的PEFT方法——Earth-Adapter,核心思路是“拆分干扰、精准治理”,具体分为三步:

1. 频率拆分:用傅里叶变换隔离干扰

通过离散傅里叶变换(DFT),将模型提取的图像特征拆分为两部分:

  • 低频特征:对应图像全局结构(如大片农田、整块建筑区),干扰少、语义清晰;

  • 高频特征:对应局部细节(如道路边缘、小地块边界),也是干扰信息的主要聚集地。 这一步相当于把“有用信息”和“干扰噪音”分离开来,为后续治理打基础。

2. 多适配器优化:针对性“修复”特征

设计了三个专门的“适配器”(可理解为三个精准工具),分别处理不同类型的特征:

  • 空间适配器:优化图像空间布局,让区域划分更精准;

  • 低频适配器:强化全局语义,确保大场景判断不跑偏;

  • 高频适配器:专门清理高频特征中的干扰,同时保留有用细节。

3. 动态融合:智能加权出最优结果

加入一个“动态路由器”,像智能裁判一样,根据图像实际情况给三个适配器的结果分配不同权重,再通过残差连接与原始模型特征融合。既保留了视觉基础模型的强大能力,又通过“去干扰”优化了特征质量。

整个流程参数高效(仅2.6M-9.6M可训练参数),且不改变原始模型结构,适配性极强。

三、实验结果:三大任务全面领先

研究团队在12个主流遥感图像分割基准数据集上,对Earth-Adapter进行了全面测试,涵盖普通语义分割(SS)、跨域自适应(DA)、跨域泛化(DG)三大核心任务,结果亮眼:

1. 普通语义分割(SS)

在Potsdam、Vaihingen等4个数据集上,平均mIoU(分割准确率指标)达到68.8%,比基线模型Rein提升1.2%,在所有PEFT方法中排名第一。

2. 跨域自适应(DA)

面对不同场景(如城市到乡村、A数据集到B数据集)的适配挑战,Earth-Adapter平均mIoU达59.0%,较基线提升9.0%,其中在“城市到乡村(U2R)”任务中,性能提升高达24.0%,彻底解决了跨场景适配难题。

3. 跨域泛化(DG)

在无目标域标签的情况下,模型平均mIoU达56.2%,比基线提升3.1%,展现出极强的通用性,无需重新训练就能适配新场景。

此外,Earth-Adapter在参数规模更小的情况下,训练和推理速度与基线模型基本持平,实现了“性能、效率、通用性”三者兼顾。

四、优势与局限

核心优势

  1. 针对性强:首个专门解决遥感图像干扰问题的PEFT方法,直击行业痛点;

  2. 高效灵活:仅需少量可训练参数,适配不同规模的视觉基础模型(DINOv2-S/B/L等),且不依赖遥感预训练数据;

  3. 场景覆盖广:在普通分割、跨域适配、跨域泛化三大任务中均达SOTA水平,应用场景更全面;

  4. 易落地:训练推理速度快,无需大规模算力支持,便于实际业务部署。

现存局限

  1. 对参数配置敏感:部分任务中,适配器维度、频率 cutoff 值等参数需要精细调整才能达到最优性能;

  2. 高频特征处理仍有优化空间:单独使用高频适配器时性能下降明显,对高频干扰的治理能力可进一步提升;

  3. 多模态适配不足:目前仅针对光学遥感图像优化,尚未拓展到SAR、红外等多模态遥感数据。

五、一句话总结

Earth-Adapter通过“频率拆分+多适配器优化+动态融合”的创新思路,攻克了视觉基础模型在遥感图像分割中的干扰难题,以高效、通用的优势成为该领域的SOTA方案,为遥感AI的工程化落地提供了新路径。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 9:17:13

41、深入了解 IPv6:从基础到实践应用

深入了解 IPv6:从基础到实践应用 1. IPv6 发展现状 如今,IPv6 的发展已取得显著进展。大部分网络硬件,如交换机、接口和路由器等,都已支持 IPv6。同时,相机、手机、个人数字助理(PDA)等各类设备也纷纷加入支持行列。越来越多的互联网服务提供商(ISP)开始提供原生 IP…

作者头像 李华
网站建设 2026/4/18 9:21:15

Audacity音频编辑实战指南:2024年免费开源工具完全指南

还在为音频编辑软件的高昂费用发愁吗?🤔 别担心!Audacity这款完全免费的音频编辑工具,让你零成本享受专业级的音频处理体验。无论你是播客制作人、音乐爱好者还是音频教学者,这篇指南都将为你解锁Audacity的全部潜力&a…

作者头像 李华
网站建设 2026/4/18 9:18:53

5、雾无线接入网络:架构、原理与性能分析

雾无线接入网络:架构、原理与性能分析 在当今的通信领域,雾无线接入网络(F-RAN)正逐渐崭露头角,它结合了雾计算和无线接入网络的优势,为未来的通信发展提供了新的可能。同时,人工智能(AI)技术的融入,更是为F-RAN的发展注入了强大的动力。本文将深入探讨F-RAN的系统架…

作者头像 李华
网站建设 2026/4/18 5:41:20

15、雾无线接入网络中的计算卸载优化

雾无线接入网络中的计算卸载优化 在雾无线接入网络(F-RANs)中,计算卸载是提高系统性能的关键技术。本文将深入探讨F-RANs中计算卸载的性能分析、概率与延迟计算,以及进一步的卸载策略优化和联合资源分配与卸载决策的优化问题。 1. 计算卸载模式及延迟分析 计算卸载主要有…

作者头像 李华
网站建设 2026/4/18 7:54:44

Forth编程中的文件搜索:深入理解scan-file

在Forth编程中,文件I/O操作是一个重要的学习内容。最近在学习Forth时,我遇到了关于scan-file词的一个有趣问题。通过这个博客,我希望与大家分享我对这个问题的理解,并提供一个改进后的实例来帮助大家更好地掌握这一概念。 初识问题 在学习一个关于Forth文件I/O的教程时,…

作者头像 李华
网站建设 2026/4/18 7:55:18

GitHub热门项目盘点:哪些开源项目集成了Qwen3-VL-30B?

GitHub热门项目盘点:哪些开源项目集成了Qwen3-VL-30B? 在AI从“感知”迈向“认知”的今天,一个明显趋势正在浮现:越来越多的开源项目不再满足于让模型“识别图像中的猫”,而是希望它能回答“为什么这只猫站在冰箱顶上&…

作者头像 李华