最小作用量学习:AI如何通过能量约束从噪声数据中发现物理定律

一项名为“最小作用量学习”的新型AI框架,正在引发科学机器学习领域的范式变革。该系统通过最小化一个融合数据拟合、模型简洁性与能量守恒等物理约束的“三重作用量泛函”,能够以前所未有的精度从高度噪声数据中识别出基础物理定律。

科学机器学习领域取得了一项重大突破,其核心是名为“最小作用量学习”的框架。该框架旨在从充满噪声的观测数据中,自动发现可解释的物理定律。与产出“黑箱”预测的传统神经网络方法不同,该方法通过从预定义的、代表潜在力定律的基函数库中进行符号模型选择来运作。其核心创新在于构建了一个统一的优化问题,以最小化一个“三重作用量泛函”。该泛函同时兼顾三个关键目标:精确重建观测到的运动轨迹;通过架构稀疏性约束选择最简单的可行模型;以及纳入能量守恒等基础物理约束。这使得系统即使在数据信噪比极低的情况下,也能稳健地推导出如牛顿万有引力定律等简洁的符号表达式,为从天文观测到生物力学等众多依赖嘈杂真实世界数据的科学领域开辟了新道路。

技术深度解析

最小作用量学习(MAL)是符号回归、物理信息神经网络(PINNs)以及非线性动力学稀疏识别(SINDy)的复杂综合体。该框架的架构通过多个相互关联的计算层运作。

其基础是一个预设的基函数库,其中包含了符号力定律的候选项——通常是多项式、三角函数或其他领域相关的数学表达式。对于一个粒子系统,这可能包括 $\dot{x}$、$\dot{y}$、$x^2$、$y^2$、$xy$、$\sin(\theta)$ 等项。库的设计需要领域专业知识,但遵循符号回归研究中的既定实践。

核心创新在于算法最小化的三重作用量泛函 $\mathcal{S}[\mathbf{f}, \mathbf{x}]$:

$$\mathcal{S} = \underbrace{\lambda_1 \mathcal{L}_{\text{data}}(\mathbf{x}, \mathbf{x}_{\text{obs}})}_{\text{轨迹重建项}} + \underbrace{\lambda_2 \mathcal{R}(\mathbf{f})}_{\text{架构稀疏性项}} + \underbrace{\lambda_3 \mathcal{C}_{\text{energy}}(\mathbf{x}, \mathbf{f})}_{\text{能量约束项}}$$

其中 $\mathbf{f}$ 代表正在被发现的符号力定律,$\mathbf{x}$ 是重建的轨迹,$\lambda_i$ 是平衡三个目标的正则化参数。

轨迹重建项 $\mathcal{L}_{\text{data}}$ 衡量重建位置/速度与观测值之间的差异。架构稀疏性项 $\mathcal{R}(\mathbf{f})$ 促进简单模型,通常使用 L1 正则化(LASSO)或顺序阈值最小二乘法,将大多数基函数系数驱动为零。能量约束项 $\mathcal{C}_{\text{energy}}$ 是最新颖的组成部分,它强制要求发现的力定律沿轨迹守恒总机械能(动能+势能),或对于非保守系统表现出可预测的耗散模式。

宽模板加速度匹配技术值得特别关注。传统方法直接比较观测加速度与预测加速度,这在二次微分位置数据时会放大噪声。MAL 则改为在“宽模板”——即噪声效应会被平均掉的时间窗口——上比较积分量。这在数学上等同于比较作用量而非瞬时值,利用了经典力学的路径积分表述。报道中所称的 10000 倍噪声方差降低,正是源于这种统计平均效应与能量约束正则化能力的结合。

实施通常涉及交替优化:(1) 固定力定律 $\mathbf{f}$,优化轨迹 $\mathbf{x}$ 以满足数据和能量约束;(2) 固定轨迹,在稀疏性强制下优化 $\mathbf{f}$ 的系数。该过程迭代进行,直至收敛到一个稀疏、能量守恒且拟合数据的模型。

| 方法 | 噪声容忍度 | 可解释性 | 物理一致性 | 计算成本 |
|------------|---------------------|----------------------|-------------------------|------------------------|
| 最小作用量学习 | 极高(降低10000倍) | 高(符号输出) | 内置(能量约束) | 高(双层优化) |
| 标准 PINNs | 中等 | 低(神经网络) | 软约束(损失项) | 中等 |
| SINDy | 低 | 高(符号输出) | 无 | 低 |
| 深度符号回归 | 中等 | 高 | 无 | 极高 |

数据要点: 上表揭示了 MAL 的独特定位,它是唯一将极高噪声容忍度、有保障的物理一致性和完全可解释性结合起来的方法,尽管计算成本更高。这使其特别适用于测量噪声大且物理合理性不容妥协的真实世界科学数据。

相关的开源实现包括 PySINDy (github.com/dynamicslab/pysindy),它提供了基础的稀疏识别算法;以及 DeepXDE (github.com/lululxvi/deepxde),用于物理信息神经网络,其约束公式与 MAL 有共同概念基础。虽然目前尚无公共代码库包含完整的 MAL 框架,但其组件直接构建于这些成熟的库之上。

关键参与者与案例研究

最小作用量学习的发展源于计算物理学与机器学习交叉领域的学术研究小组。主要贡献者包括来自加州理工学院计算与数学科学系麻省理工学院机械工程系的研究人员,类似的物理约束学习范式在这些地方已发展数年。

一个开创性的案例研究展示了 MAL 从模拟行星运动数据中识别出牛顿万有引力定律

延伸阅读

热力学神经网络:物理学如何成为AI的母语人工智能与物理学的关系正在经历根本性变革。这一领域正超越仅将物理方程作为约束条件的传统范式,转向构建其架构本身便诞生于热力学原理的神经网络。这场变革预示着AI将不再仅仅是近似模拟物理,而是内在地掌握其语言,从而实现对复杂系统的可靠仿真。UniFluids横空出世:通用AI模型能否统一物理仿真?名为UniFluids的新型AI框架正挑战数十年来的专业科学计算范式。它通过训练单一模型求解海量物理方程,承诺将仿真从一门手艺转变为可规模化服务。这一突破或将加速工程、生物医学与气候科学领域的发现进程。破解AI黑箱:新型正则化技术如何重塑高危医疗预后决策一项研究突破通过开发两种新颖的正则化技术,成功训练出能高精度预测多发性骨髓瘤患者五年生存率且完全透明的AI模型。这标志着AI从“预测神谕”向“可问责临床伙伴”的范式转变,为临床AI落地扫清了最顽固的障碍。图基础模型掀起无线网络革命,实现实时自主资源分配无线网络正站在智能化变革的临界点。针对资源分配的图基础模型新兴研究,将整个网络基础设施视为一个动态、可学习的图,有望解决超密集网络中的实时优化危机。这一转变或将催生真正能根据不同目标自我优化的自主网络,为6G时代奠定关键基石。

常见问题

GitHub 热点“Minimum Action Learning: How AI Discovers Physics Laws from Noisy Data Using Energy Constraints”主要讲了什么?

The field of scientific machine learning has achieved a significant breakthrough with the development of Minimum Action Learning, a framework designed to automatically discover int…

这个 GitHub 项目在“minimum action learning Python implementation GitHub”上为什么会引发关注?

Minimum Action Learning (MAL) represents a sophisticated synthesis of symbolic regression, physics-informed neural networks (PINNs), and sparse identification of nonlinear dynamics (SINDy). The framework's architecture o…

从“physics-informed symbolic regression code example”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。