Koopman 算子与信息论的交叉:ICLR 2026 Oral 论文给嵌入式 AI 控制带来了什么
方向:AI / 嵌入式 / 机器人控制 / 物理仿真 / 论文解读
做嵌入式机器人控制的工程师,很可能没怎么听说过 Koopman 算子。但这套理论实际上在解决一个你每天都在碰的问题:非线性动力系统的预测和控制。
2026年4月23日,ICLR 2026 的一篇 Oral 论文——《Information Shapes Koopman Representation》——把 Koopman 表征学习和信息论融合在了一起,在软体机器人、流体仿真、全球天气预报等场景下取得了显著的性能提升。
这篇文章我打算从工程角度解释清楚:Koopman 算子是什么、它在控制领域为什么重要、这篇论文解决了什么问题、以及对嵌入式 AI 控制的启示。
控制非线性系统的核心困难
先回到最基础的地方。
一个简单的线性系统,状态方程是这样的:
x(t+1) = A · x(t) 其中 A 是固定的矩阵,x 是状态向量这套系统很好控制:给定当前状态,乘以矩阵 A,就知道下一时刻的状态。稳定性分析、最优控制、卡尔曼滤波,这些经典方法全部建立在线性系统上。
但真实世界的系统几乎都是非线性的:
x(t+1) = f(x(t)) f 是任意非线性函数- 一个摆锤:sin(θ) 项使得方程非线性
- 一段绳索的运动:每个节点的状态互相耦合
- 软体机器人:柔性结构的变形完全非线性
- 大气流体:卡门涡街中的漩涡演化
传统做法是在平衡点附近线性化(雅可比矩阵),但这只在邻域内有效,一旦系统偏离平衡点,线性化的近似就失效了。
Koopman 算子:非线性变线性的数学魔法
1931年,Bernard Koopman 提出了一个优雅的思路:非线性系统在原始状态空间里是非线性的,但如果把它提升到足够高维的函数空间,就可以用线性算子来描述。
用形式化语言说:
对于非线性系统: x(t+1) = f(x(t)) Koopman 算子 K 作用于观测函数 g(x): g(x(t+1)) = K · g(x(t)) 其中 g: 状态空间 → 函数空间(高维嵌入) K 是线性算子(在函数空间里的矩阵)直觉上说:原来状态空间里弯弯曲曲的轨迹,换一个坐标系(函数空间),就变成了直线。
原始状态空间: 函数(潜)空间: 线性演化 弯曲轨迹 → 直线轨迹 x₀→x₁→x₂→… φ₀→φ₁→φ₂→… 其中 φᵢ = g(xᵢ) 是状态的高维嵌入如果找到了这个嵌入函数 g,控制问题就变成了线性控制问题,经典的 LQR、MPC 都可以直接用。
为什么要用神经网络学习 g
数学上,Koopman 算子是无穷维的——完整描述非线性系统需要无穷多个基函数。实际工程里只能用有限维近似。
过去十年,研究者们开始用神经网络来学习这个嵌入函数 g,把它叫做"Koopman 表征学习"或者"深度 Koopman 方法"。
但这里有个关键问题:有限维近似下,应该保留哪些信息?
这篇论文解决了什么
核心发现:信息论视角下的权衡
论文的出发点是一个被忽视的 Trade-off:
保留太多信息 → 难以维持线性结构(嵌入空间里还是有非线性残差) 压缩太多 → 丢失关键模态,长期预测误差累积过去的 Koopman 学习方法,通常用互信息(MI)来衡量"保留了多少信息"。但论文发现:单纯最大化互信息会导致模态坍塌——模型倾向于把所有表达能力集中到少数几个主导模态,细粒度的动力学特征被丢弃了。
对软体机器人来说,这意味着:主要的刚体运动被学到了,但柔性形变的细节被遗忘了。控制器就会在需要精确操控形变的时候失效。
解决方案:动态信息瓶颈 + 冯·诺依曼熵
论文提出了一个统一的信息论框架,训练目标包含三个部分:
Loss = -互信息(MI) ← 时间连贯性:保住预测相关的模态 + 冯·诺依曼熵(VNE) ← 预测充分性:防止模态坍塌,保持多样性 + 线性前向一致性 ← 结构一致性:确保嵌入空间真的是线性的 + 重建损失 ← 信息完整性:能从潜空间还原原始状态冯·诺依曼熵(VNE)这个项是关键。它来自量子信息论,衡量的是矩阵(密度算子)的"信息多样性"——简单说,如果特征值分布很均匀,VNE 高;如果能量集中到少数几个特征值,VNE 低。
在 Koopman 学习里,最大化 VNE 等价于"鼓励模型均匀地使用各个维度的表达能力",防止模型偷懒把信息塞进少数几个维度。
实验结果
软体机器人控制
软体机器人是 Koopman 方法最有挑战性的场景之一——硅胶材料的形变是强非线性的,传统控制理论基本没有好的解法。
论文在软体机器人仿真任务里,预测精度显著优于多种 Koopman 基线方法。这是个质性的改进:以前方法在复杂形变场景下经常出现预测漂移,新方法的轨迹更稳定。
卡门涡街(流体仿真)
这是流体力学里的经典问题:圆柱绕流,周期性脱落漩涡。
──────────────────────── ──────→ ○ →→→ 漩涡 漩涡 漩涡 ──→ ────────────────────────Koopman 方法学到这个系统的特征值应该分布在单位圆附近(对应稳定的周期性演化)。但过去的方法经常出现"谱退化":特征值飘离单位圆,意味着长期预测轨迹要么发散(特征值 > 1),要么衰减为零(特征值 < 1)。
论文的方法学到的特征值更密集地分布在单位圆上,长期 rollout 的轨迹和真实动力学接近。
ERA5 全球天气预测
这是最高维的场景:ERA5 是 ECMWF 的全球大气再分析数据集,包含温度、湿度、风速、地势等多个物理场,分辨率是全球 0.25 度网格。
在这个任务上,“Information Shaped Koopman” 实现了高保真的长期天气预测,这对于传统方法来说是极难做到的。
对嵌入式 AI 控制的启示
Koopman 方法在学术界不是新东西,但这篇论文的工程含义是很直接的:
1. 轻量化的非线性控制器
用 Koopman 方法,你可以做到:
- 用神经网络学习状态嵌入 g(离线训练,不需要实时推理)
- 嵌入后的线性控制器(LQR/MPC)极其轻量,微秒级运行
- 整个控制器可以部署在 STM32H7 或 Cortex-M4 这类 MCU 上
训练阶段(离线,PC 或服务器): 收集数据 → 训练 Koopman 网络 → 提取线性化矩阵 A 部署阶段(嵌入式,MCU): 传感器数据 → 嵌入函数 g(简单前向传播)→ 线性状态 → LQR 控制律(矩阵乘法)→ 控制量输出对比端到端神经网络控制器,Koopman 方法在嵌入式部署上有明显优势:
- 推理计算量更小(线性控制律就是矩阵乘法)
- 稳定性有数学保证(线性系统的稳定性分析是成熟理论)
- 可解释性更好(特征值对应系统的模态)
2. 物理模拟加速
在机器人仿真和数字孪生场景里,高保真物理模拟(有限元、流体仿真)计算极慢,无法实时运行。
Koopman 代理模型的思路是:用神经网络学到物理系统的 Koopman 表征,用线性传播替代昂贵的物理求解器,速度快几个数量级,同时保持对物理规律的尊重(因为线性结构是从真实物理数据里学出来的,而不是凭空近似)。
局限与现实
当然,Koopman 方法也不是万能的:
- 嵌入维度的选择:有限维近似的精度依赖于正确选择嵌入维度。维度太低,近似误差大;维度太高,嵌入网络复杂,MCU 跑不动。
- 分布外泛化:如果系统工作在训练数据覆盖之外的状态,Koopman 近似可能失效。
- 训练数据需求:学习好的嵌入需要足够多、足够多样的轨迹数据。
实际工程里,Koopman 方法最适合"动力学已知但非线性严重、需要实时控制、对稳定性有要求"的场景——软体机械臂、流体驱动执行器、四旋翼无人机的姿态控制。
学术界和嵌入式控制实践之间往往有很深的鸿沟,但 Koopman 方法是为数不多的可以真正落地到 MCU 上的理论工具之一。这篇 ICLR Oral 的贡献,让这个方向的理论基础更扎实了一步。
参考资料:机器之心 “ICLR 2026 Oral|Information Shapes Koopman Representation”(2026-04-23),UCL/ICL/上海财经大学等联合研究