技术深度解析
最小作用量学习(MAL)是符号回归、物理信息神经网络(PINNs)以及非线性动力学稀疏识别(SINDy)的复杂综合体。该框架的架构通过多个相互关联的计算层运作。
其基础是一个预设的基函数库,其中包含了符号力定律的候选项——通常是多项式、三角函数或其他领域相关的数学表达式。对于一个粒子系统,这可能包括 $\dot{x}$、$\dot{y}$、$x^2$、$y^2$、$xy$、$\sin(\theta)$ 等项。库的设计需要领域专业知识,但遵循符号回归研究中的既定实践。
核心创新在于算法最小化的三重作用量泛函 $\mathcal{S}[\mathbf{f}, \mathbf{x}]$:
$$\mathcal{S} = \underbrace{\lambda_1 \mathcal{L}_{\text{data}}(\mathbf{x}, \mathbf{x}_{\text{obs}})}_{\text{轨迹重建项}} + \underbrace{\lambda_2 \mathcal{R}(\mathbf{f})}_{\text{架构稀疏性项}} + \underbrace{\lambda_3 \mathcal{C}_{\text{energy}}(\mathbf{x}, \mathbf{f})}_{\text{能量约束项}}$$
其中 $\mathbf{f}$ 代表正在被发现的符号力定律,$\mathbf{x}$ 是重建的轨迹,$\lambda_i$ 是平衡三个目标的正则化参数。
轨迹重建项 $\mathcal{L}_{\text{data}}$ 衡量重建位置/速度与观测值之间的差异。架构稀疏性项 $\mathcal{R}(\mathbf{f})$ 促进简单模型,通常使用 L1 正则化(LASSO)或顺序阈值最小二乘法,将大多数基函数系数驱动为零。能量约束项 $\mathcal{C}_{\text{energy}}$ 是最新颖的组成部分,它强制要求发现的力定律沿轨迹守恒总机械能(动能+势能),或对于非保守系统表现出可预测的耗散模式。
宽模板加速度匹配技术值得特别关注。传统方法直接比较观测加速度与预测加速度,这在二次微分位置数据时会放大噪声。MAL 则改为在“宽模板”——即噪声效应会被平均掉的时间窗口——上比较积分量。这在数学上等同于比较作用量而非瞬时值,利用了经典力学的路径积分表述。报道中所称的 10000 倍噪声方差降低,正是源于这种统计平均效应与能量约束正则化能力的结合。
实施通常涉及交替优化:(1) 固定力定律 $\mathbf{f}$,优化轨迹 $\mathbf{x}$ 以满足数据和能量约束;(2) 固定轨迹,在稀疏性强制下优化 $\mathbf{f}$ 的系数。该过程迭代进行,直至收敛到一个稀疏、能量守恒且拟合数据的模型。
| 方法 | 噪声容忍度 | 可解释性 | 物理一致性 | 计算成本 |
|------------|---------------------|----------------------|-------------------------|------------------------|
| 最小作用量学习 | 极高(降低10000倍) | 高(符号输出) | 内置(能量约束) | 高(双层优化) |
| 标准 PINNs | 中等 | 低(神经网络) | 软约束(损失项) | 中等 |
| SINDy | 低 | 高(符号输出) | 无 | 低 |
| 深度符号回归 | 中等 | 高 | 无 | 极高 |
数据要点: 上表揭示了 MAL 的独特定位,它是唯一将极高噪声容忍度、有保障的物理一致性和完全可解释性结合起来的方法,尽管计算成本更高。这使其特别适用于测量噪声大且物理合理性不容妥协的真实世界科学数据。
相关的开源实现包括 PySINDy (github.com/dynamicslab/pysindy),它提供了基础的稀疏识别算法;以及 DeepXDE (github.com/lululxvi/deepxde),用于物理信息神经网络,其约束公式与 MAL 有共同概念基础。虽然目前尚无公共代码库包含完整的 MAL 框架,但其组件直接构建于这些成熟的库之上。
关键参与者与案例研究
最小作用量学习的发展源于计算物理学与机器学习交叉领域的学术研究小组。主要贡献者包括来自加州理工学院计算与数学科学系和麻省理工学院机械工程系的研究人员,类似的物理约束学习范式在这些地方已发展数年。
一个开创性的案例研究展示了 MAL 从模拟行星运动数据中识别出牛顿万有引力定律。