Koopman算子与信息论的交叉-ICLR2026Oral给嵌入式AI控制带来了什么-程序员充电站

Koopman 算子与信息论的交叉：ICLR 2026 Oral 论文给嵌入式 AI 控制带来了什么

方向：AI / 嵌入式 / 机器人控制 / 物理仿真 / 论文解读

做嵌入式机器人控制的工程师，很可能没怎么听说过 Koopman 算子。但这套理论实际上在解决一个你每天都在碰的问题：非线性动力系统的预测和控制。

2026年4月23日，ICLR 2026 的一篇 Oral 论文——《Information Shapes Koopman Representation》——把 Koopman 表征学习和信息论融合在了一起，在软体机器人、流体仿真、全球天气预报等场景下取得了显著的性能提升。

这篇文章我打算从工程角度解释清楚：Koopman 算子是什么、它在控制领域为什么重要、这篇论文解决了什么问题、以及对嵌入式 AI 控制的启示。

控制非线性系统的核心困难

先回到最基础的地方。

一个简单的线性系统，状态方程是这样的：

x(t+1) = A · x(t) 其中 A 是固定的矩阵，x 是状态向量

这套系统很好控制：给定当前状态，乘以矩阵 A，就知道下一时刻的状态。稳定性分析、最优控制、卡尔曼滤波，这些经典方法全部建立在线性系统上。

但真实世界的系统几乎都是非线性的：

x(t+1) = f(x(t)) f 是任意非线性函数

一个摆锤：sin(θ) 项使得方程非线性
一段绳索的运动：每个节点的状态互相耦合
软体机器人：柔性结构的变形完全非线性
大气流体：卡门涡街中的漩涡演化

传统做法是在平衡点附近线性化（雅可比矩阵），但这只在邻域内有效，一旦系统偏离平衡点，线性化的近似就失效了。

Koopman 算子：非线性变线性的数学魔法

1931年，Bernard Koopman 提出了一个优雅的思路：非线性系统在原始状态空间里是非线性的，但如果把它提升到足够高维的函数空间，就可以用线性算子来描述。

用形式化语言说：

对于非线性系统： x(t+1) = f(x(t)) Koopman 算子 K 作用于观测函数 g(x)： g(x(t+1)) = K · g(x(t)) 其中 g: 状态空间 → 函数空间（高维嵌入） K 是线性算子（在函数空间里的矩阵）

直觉上说：原来状态空间里弯弯曲曲的轨迹，换一个坐标系（函数空间），就变成了直线。

原始状态空间： 函数（潜）空间： 线性演化 弯曲轨迹 → 直线轨迹 x₀→x₁→x₂→… φ₀→φ₁→φ₂→… 其中 φᵢ = g(xᵢ) 是状态的高维嵌入

如果找到了这个嵌入函数 g，控制问题就变成了线性控制问题，经典的 LQR、MPC 都可以直接用。

为什么要用神经网络学习 g

数学上，Koopman 算子是无穷维的——完整描述非线性系统需要无穷多个基函数。实际工程里只能用有限维近似。

过去十年，研究者们开始用神经网络来学习这个嵌入函数 g，把它叫做"Koopman 表征学习"或者"深度 Koopman 方法"。

但这里有个关键问题：有限维近似下，应该保留哪些信息？

这篇论文解决了什么

核心发现：信息论视角下的权衡

论文的出发点是一个被忽视的 Trade-off：

保留太多信息 → 难以维持线性结构（嵌入空间里还是有非线性残差） 压缩太多 → 丢失关键模态，长期预测误差累积

过去的 Koopman 学习方法，通常用互信息（MI）来衡量"保留了多少信息"。但论文发现：单纯最大化互信息会导致模态坍塌——模型倾向于把所有表达能力集中到少数几个主导模态，细粒度的动力学特征被丢弃了。

对软体机器人来说，这意味着：主要的刚体运动被学到了，但柔性形变的细节被遗忘了。控制器就会在需要精确操控形变的时候失效。

解决方案：动态信息瓶颈 + 冯·诺依曼熵

论文提出了一个统一的信息论框架，训练目标包含三个部分：

Loss = -互信息(MI) ← 时间连贯性：保住预测相关的模态 + 冯·诺依曼熵(VNE) ← 预测充分性：防止模态坍塌，保持多样性 + 线性前向一致性 ← 结构一致性：确保嵌入空间真的是线性的 + 重建损失 ← 信息完整性：能从潜空间还原原始状态

冯·诺依曼熵（VNE）这个项是关键。它来自量子信息论，衡量的是矩阵（密度算子）的"信息多样性"——简单说，如果特征值分布很均匀，VNE 高；如果能量集中到少数几个特征值，VNE 低。

在 Koopman 学习里，最大化 VNE 等价于"鼓励模型均匀地使用各个维度的表达能力"，防止模型偷懒把信息塞进少数几个维度。

实验结果

软体机器人控制

软体机器人是 Koopman 方法最有挑战性的场景之一——硅胶材料的形变是强非线性的，传统控制理论基本没有好的解法。

论文在软体机器人仿真任务里，预测精度显著优于多种 Koopman 基线方法。这是个质性的改进：以前方法在复杂形变场景下经常出现预测漂移，新方法的轨迹更稳定。

卡门涡街（流体仿真）

这是流体力学里的经典问题：圆柱绕流，周期性脱落漩涡。

──────────────────────── ──────→ ○ →→→ 漩涡 漩涡 漩涡 ──→ ────────────────────────

Koopman 方法学到这个系统的特征值应该分布在单位圆附近（对应稳定的周期性演化）。但过去的方法经常出现"谱退化"：特征值飘离单位圆，意味着长期预测轨迹要么发散（特征值 > 1），要么衰减为零（特征值 < 1）。

论文的方法学到的特征值更密集地分布在单位圆上，长期 rollout 的轨迹和真实动力学接近。

ERA5 全球天气预测

这是最高维的场景：ERA5 是 ECMWF 的全球大气再分析数据集，包含温度、湿度、风速、地势等多个物理场，分辨率是全球 0.25 度网格。

在这个任务上，“Information Shaped Koopman” 实现了高保真的长期天气预测，这对于传统方法来说是极难做到的。

对嵌入式 AI 控制的启示

Koopman 方法在学术界不是新东西，但这篇论文的工程含义是很直接的：

1. 轻量化的非线性控制器

用 Koopman 方法，你可以做到：

用神经网络学习状态嵌入 g（离线训练，不需要实时推理）
嵌入后的线性控制器（LQR/MPC）极其轻量，微秒级运行
整个控制器可以部署在 STM32H7 或 Cortex-M4 这类 MCU 上

训练阶段（离线，PC 或服务器）： 收集数据 → 训练 Koopman 网络 → 提取线性化矩阵 A 部署阶段（嵌入式，MCU）： 传感器数据 → 嵌入函数 g（简单前向传播）→ 线性状态 → LQR 控制律（矩阵乘法）→ 控制量输出

对比端到端神经网络控制器，Koopman 方法在嵌入式部署上有明显优势：

推理计算量更小（线性控制律就是矩阵乘法）
稳定性有数学保证（线性系统的稳定性分析是成熟理论）
可解释性更好（特征值对应系统的模态）

2. 物理模拟加速

在机器人仿真和数字孪生场景里，高保真物理模拟（有限元、流体仿真）计算极慢，无法实时运行。

Koopman 代理模型的思路是：用神经网络学到物理系统的 Koopman 表征，用线性传播替代昂贵的物理求解器，速度快几个数量级，同时保持对物理规律的尊重（因为线性结构是从真实物理数据里学出来的，而不是凭空近似）。

局限与现实

当然，Koopman 方法也不是万能的：

嵌入维度的选择：有限维近似的精度依赖于正确选择嵌入维度。维度太低，近似误差大；维度太高，嵌入网络复杂，MCU 跑不动。
分布外泛化：如果系统工作在训练数据覆盖之外的状态，Koopman 近似可能失效。
训练数据需求：学习好的嵌入需要足够多、足够多样的轨迹数据。

实际工程里，Koopman 方法最适合"动力学已知但非线性严重、需要实时控制、对稳定性有要求"的场景——软体机械臂、流体驱动执行器、四旋翼无人机的姿态控制。

学术界和嵌入式控制实践之间往往有很深的鸿沟，但 Koopman 方法是为数不多的可以真正落地到 MCU 上的理论工具之一。这篇 ICLR Oral 的贡献，让这个方向的理论基础更扎实了一步。

参考资料：机器之心 “ICLR 2026 Oral｜Information Shapes Koopman Representation”（2026-04-23），UCL/ICL/上海财经大学等联合研究

Koopman算子与信息论的交叉-ICLR2026Oral给嵌入式AI控制带来了什么