news 2026/4/18 11:02:20

(ICLR26) Task-Adaptive Parameter-Efficient Fine-Tuning for Weather Foundation Models

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
(ICLR26) Task-Adaptive Parameter-Efficient Fine-Tuning for Weather Foundation Models

这篇论文聚焦天气基础模型(WFMs)的参数高效微调问题,提出了首个针对气象任务特性的 WeatherPEFT 框架,核心是在少量可训练参数下实现与全微调相当的性能。

1、研究动机

WFMs 的优势与挑战:天气基础模型通过大规模预训练获得强泛化能力,但模型规模扩大(达数十亿参数)导致全微调的计算和存储成本过高,难以落地。

现有 PEFT 方法的局限:自然语言处理和计算机视觉领域的 Parameter-Efficient Fine-Tuning (PEFT) 方法(如 LoRA、DoRA)无法适配气象下游任务的特殊性 —— 变量异质性(如温度、湿度)、分辨率多样性(如 0.25°~5.625°)、时空覆盖差异(全球 vs 区域),导致性能不佳。


2、整体框架

作者提出了 WeatherPEFT——一种面向天气基础模型(WFMs)的新型参数高效微调(PEFT)框架。如下图所示,包含两个核心模块:任务自适应动态提示(TADP)随机费雪引导自适应选择(SFAS)。其中,TADP 通过适配模型的前向传播过程以匹配任务专属特性,SFAS 则在反向传播阶段主导后续的参数更新。

数据输入embedding layer 得到4维张量 E ,各维度分别表示:D是隐藏维度(hidden dimension),存储气象特征的抽象表征;V是物理变量数,如温度、湿度、风速等;Ph×Pw:是空间尺寸,对应数据的分辨率与空间覆盖范围(如 Ph=32, Pw=64 代表 32×64 的网格精度)。首先将 E 输入 TADP 模块处理。

任务自适应动态提示(TADP),包括两个步骤

  • 内部模式提取:用三个适配器(HW-Adapter、V-Adapter、D-Adapter)分别在三个维度进行微调
  • 外部模式整合:合并V,Ph,Pw,通过自注意力机制建模物理变量与空间分辨率的耦合关系,生成 soft prompt token

随机费雪引导自适应选择(SFAS):气象下游任务差异极大(如全球降尺度 vs 区域降水预报),模型中不同参数的重要性的天差地别。比如负责 “空间关系建模” 的参数对降尺度任务至关重要,但对区域降水预报可能作用有限。SFAS 的核心目标是在保留大模型气象知识的前提下,精准筛选并更新对当前气象任务最关键的少量参数,避免 “全参数微调” 的高成本和 “通用 PEFT” 的适配性差问题。 SFAS包括三个部分:

  • 用费雪信息矩阵量化参数重要性。费雪信息矩阵(Fisher Information Matrix)是衡量 “参数微小变化对模型输出影响程度” 的指标 —— 参数对任务的影响越大,其对应的费雪信息值越高,说明该参数是任务关键参数。SFAS 采用对角矩阵近似,避免计算量爆炸,仅需量化每个参数的独立重要性(如温度变量对应的参数、某一分辨率对应的空间参数)。通过模型预测分布与真实标签的对数似然梯度计算,近似得到每个参数的费雪信息值(公式见Eq.6-7),值越高的参数越优先被选择更新。

  • 退火随机成分稳定选择过程。微调初期,模型参数可能受数据噪声影响,导致部分高费雪信息值的参数是 “伪关键参数”(仅适配噪声,而非任务本质),直接按费雪值筛选会导致过拟合或性能波动。因此,引入随训练进程线性衰减的随机向量(公式见 Eq.8)。训练初期(随机成分权重高):给参数重要性值加入少量随机扰动,避免过度聚焦于初期噪声相关参数;训练后期(随机成分权重趋近于 0):逐渐依赖真实费雪信息值,精准锁定任务核心参数。这个步骤通过平衡 “参数选择的准确性” 与 “训练稳定性”,尤其适配气象数据中极端事件(如暴雨、寒潮)的稀疏性带来的噪声问题。

  • 自适应参数子集筛选与更新。根据 “费雪信息值 + 随机扰动后的综合得分”,选择 Top-k 比例的参数(k 为超参数,可设为 0.1%~4%)组成 “任务专属可训练参数子集”,其余参数冻结(保留大模型的通用气象知识)。仅对筛选出的子集参数进行梯度下降更新,无需调整整个模型的数十亿参数 —— 例如在 Aurora(1.3B 参数)模型上,k=0.1% 时仅需更新 1.3M 参数,大幅降低计算和存储成本。


3、实验结果

实验设置:基于 Aurora(1.3B 参数)和 Prithvi-WxC(2.3B 参数)两个气象大模型,在三个典型气象任务上测试:全球降尺度、集合预报后处理、区域降水预报。

核心结果

  1. 降尺度任务:仅用 3.48M 可训练参数(占模型总量 0.28%),RMSE 指标优于所有现有 PEFT 方法,接近全微调(1239.94M 参数)。
  2. 集合预报后处理:3.18M 参数实现与全微调相当的 CRPS 分数,Z500 变量上甚至超越全微调。
  3. 区域降水预报:52.37M 参数(占模型 4%)在 SEEPS、ACC 指标上超过全微调,精准捕捉强降水的局部化特征。

**消融实验:**TADP 和 SFAS 单独使用均有效,协同后性能最优;SFAS 的随机成分可降低参数选择波动,TADP 的内外模式提取对适配异质数据至关重要。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 7:00:29

导师严选8个降AIGC平台 千笔AI解决AI率过高难题

AI降重工具:让论文更自然,让学术更安心 在当前的学术环境中,越来越多的高校和导师开始重视论文的原创性与人工痕迹。尤其是随着AIGC(人工智能生成内容)技术的广泛应用,许多学生发现自己的论文被系统标记为…

作者头像 李华
网站建设 2026/4/18 2:46:17

互联网医院如何通过JS实现电子病历截图到网页的自动命名?

江西铁路行业集团公司项目需求解决方案 项目背景 作为江西铁路行业集团公司的项目负责人,我近期负责一个企业网站后台管理系统的升级项目。项目新增需求包括在文章发布模块中增加Word粘贴功能、Word文档导入功能以及微信公众号内容粘贴功能。这些功能需要通过在We…

作者头像 李华
网站建设 2026/4/18 8:02:15

开题报告 springboot和vue易物小屋网站的设计与实现

目录项目背景与意义技术选型核心功能模块系统架构设计创新点与难点预期成果项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作项目背景与意义 随着共享经济和环保理念的普及,以物易物的需求逐渐增…

作者头像 李华
网站建设 2026/4/18 7:04:34

BeautifulSoup爬虫教程:网页数据提取基础与安装配置

对于想要从网页提取数据的开发者来说,BeautifulSoup是一个简单高效的Python库。它能够将复杂的HTML文档转换为树形结构,让我们用简洁的语法定位和提取所需内容。掌握它的核心用法,可以快速搭建起数据采集的基础框架。 BeautifulSoup如何安装配…

作者头像 李华
网站建设 2026/4/18 9:41:12

开题报告 springboot和vue小区物业管理系统 文献综述

目录 开题报告文献综述:SpringBoot与Vue的小区物业管理系统技术背景与现状相关研究与应用案例技术难点与创新方向 项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作 开题报告文献综述&#xff1a…

作者头像 李华
网站建设 2026/4/15 9:51:49

2007-2024年上市公司高管绿色认知数据

数据简介 高管绿色认知是指企业高层管理人员对环境保护和可持续发展的认识和行动。本数据借鉴李亚兵等(2022)针对高管环保认知的衡量手段,运用文本分析法对上市公司年报展开剖析。从绿色竞争优势意识、企业社会责任意识、外部环境压力认知这…

作者头像 李华