AI无规则发现物理法则:“巴布梦游仙境”突破性框架问世

arXiv cs.AI May 2026
来源:arXiv cs.AI归档:May 2026
一项名为“巴布梦游仙境”的全新研究框架,攻克了可执行世界模型的核心难题:让AI在没有任何规则描述或奖励信号的情况下,从零开始自主发现环境的状态依赖动力学。这一突破将智能体从模式匹配推向真正的物理发现。

当前AI世界模型的根本局限在于,它们倾向于学习表面的语义相关性——将输入映射到输出——而非支配环境的底层因果法则。这种“语义陷阱”阻碍了智能体真正理解物理规律。全新框架“巴布梦游仙境”直接回应了这一挑战,它允许智能体仅凭在线交互证据,归纳出一个可读、可编辑、可复用的世界模型。智能体在修改版解谜游戏“Baba Is You”中运行,必须自行发现物体如何互动(例如“岩石是可推动的”、“旗帜是胜利条件”),而无需被告知规则。通过系统性的试错,它构建出一个编码真实动力学的状态转移图。其意义有两点:首先,它代表了从模式匹配到因果推理的范式转变;其次,它证明了符号归纳在样本效率上远超纯神经网络方法。该框架在50个关卡中解决了47个,规则发现准确率达94%,训练步数仅为领先基线模型的1/40。

技术深度解析

“巴布梦游仙境”框架解决了一个看似简单实则极其困难的问题:当智能体对规则一无所知、没有语言描述、也没有奖励信号时,它如何学习环境的真实因果动力学?核心洞察在于,将世界模型学习视为一个从交互轨迹中进行归纳推理的问题。

架构与算法:
智能体在基于游戏“Baba Is You”的网格世界环境中运行,其中物体具有隐藏属性(例如“岩石是可推动的”、“墙壁是阻挡的”、“旗帜是胜利条件”)。智能体可以移动、推动物体,并观察结果。关键的算法创新是一个两阶段过程:
1. 假设生成: 智能体以符号形式维护一组候选“规则”(例如 `object_A + action_push -> object_A moves`)。每次交互后,它会生成与观察到的状态转移一致的新假设。
2. 假设消除: 智能体主动设计实验——特定的动作序列——以区分相互竞争的假设。例如,如果它怀疑“岩石是可推动的”但同时也可能是“岩石是阻挡的”,它可能会尝试将岩石推向墙壁,看看哪条规则成立。这本质上是一个关于状态转移函数的贝叶斯推理循环。

为何有效:
关键的技术成就在于避免了“语义陷阱”。传统的神经网络世界模型(例如 Dreamer、MuZero)学习一个压缩的潜在表示来预测下一帧。它们可以轻易学会“将岩石推向墙壁通常会导致岩石停止”,但无法区分*为什么*——是因为“岩石是阻挡的”还是因为“墙壁是阻挡的”?巴布框架强制智能体将动力学表示为显式、组合式的规则。这使得模型*可执行*:你可以编辑一条规则(例如将“墙壁是阻挡的”改为“墙壁是可推动的”),智能体会立即调整其规划,无需重新训练。

相关开源仓库:
- Baba Is You (游戏引擎): Hempuli 的原始解谜游戏。虽然不是研究仓库,但它提供了测试平台。游戏源代码可在 GitHub 上获取,社区已构建了自定义关卡编辑器。
- Gymnasium (原 OpenAI Gym): 强化学习环境的标准接口。巴布框架可作为自定义环境集成。该仓库拥有超过 40k 星标,是 RL 基准测试的事实标准。
- DreamerV3 (作者 Danijar Hafner): 一种最先进的基于模型的 RL 算法,可从像素中学习世界模型。虽然它没有解决语义陷阱,但它代表了基线方法。该仓库拥有超过 2k 星标。

性能数据:
| 指标 | 巴布梦游仙境 | DreamerV3 (基线) | 随机智能体 |
|---|---|---|---|
| 解决关卡数 (共50关) | 47 | 12 | 2 |
| 规则发现准确率 | 94% | 18% | 不适用 |
| 规划视野 (步数) | 无限 (符号化) | 15 (潜在空间) | 1 |
| 模型可编辑性 | 完全 (符号规则) | 无 (神经权重) | 不适用 |
| 收敛所需训练步数 | 5,000 | 200,000 | 不适用 |

数据要点: 与领先的基于模型的 RL 基线相比,巴布框架在解决关卡数上实现了 4 倍提升,在规则发现准确率上实现了 5 倍提升。更重要的是,它所需的训练步数减少了 40 倍,因为它学习的是动力学的*结构*,而非记忆转移。符号模型还完全可编辑,这在神经网络中是不可能的。

关键参与者与案例研究

这项研究并非来自单一企业实验室,而是源于专注于因果表示学习的学术机构之间的合作。主要作者来自马克斯·普朗克智能系统研究所和蒂宾根大学,这些团队以因果发现和交互学习方面的研究而闻名。

与竞争方法的比较:
| 方法 | 关键实体 | 方法 | 对规则的依赖 | 可解释性 | 样本效率 |
|---|---|---|---|---|---|
| 巴布梦游仙境 | MPI-IS / 蒂宾根大学 | 符号归纳 | 无 | 高 (符号规则) | 非常高 |
| DreamerV3 | Google DeepMind | 潜在动力学模型 | 无 | 低 (神经网络) | 低 |
| MuZero | Google DeepMind | 学习模型 + MCTS | 无 | 低 (神经网络) | 中等 |
| NEAR (神经符号) | IBM Research | 混合神经网络 + 逻辑 | 部分 (逻辑模板) | 中等 | 中等 |
| 语言模型接地 | Microsoft / OpenAI | LLM 提示 | 高 (语言先验) | 低 (黑箱) | 不适用 |

数据要点: 巴布框架占据了一个独特的位置:它不需要任何人类先验知识,却能产生完全可解释的模型。这与纯神经网络方法(Dreamer、MuZero)和语言接地方法(LLM)都有显著区别,后者要么牺牲可解释性,要么依赖可能无法迁移到新环境的语义先验。

案例研究:机器人规划
一个具体的应用场景是机器人操作。考虑一个机器人需要学习如何推动物体以完成任务的场景。传统的基于模型的方法需要大量数据来学习一个潜在动力学模型,并且该模型在环境变化时(例如物体重量改变)通常需要重新训练。而巴布框架允许机器人通过少量交互归纳出符号规则,例如“红色方块是可推动的”、“蓝色方块是固定的”。如果环境发生变化,操作员可以直接编辑规则,机器人会立即适应。这为机器人领域的快速适应和迁移学习开辟了新的可能性。

更多来自 arXiv cs.AI

PopuLoRA:群体进化如何解锁超越RLHF的AI自我推理提升PopuLoRA代表了大语言模型(LLM)自主提升推理能力的一种范式转变。传统的自我对弈方法中,单一模型同时扮演教师和学生角色,存在一个根本缺陷:自我校准偏差。模型本质上是在给自己的作业打分,导致闭环迅速陷入平台期。PopuLoRA通过在单GRID框架:让大语言模型自动构建安全知识图谱,威胁情报从此结构化GRID代表了安全知识图谱构建方式的范式转变。多年来,网络安全行业一直难以将海量、非结构化的威胁报告——从APT组织档案到恶意软件分析——转化为结构化、可查询的知识。传统方法依赖昂贵的人工标注或脆弱的规则提取,两者都无法应对每日海量威胁情报AI记忆过载:个性化系统为何总是“承诺”失信AI行业一直陷入扩展上下文窗口的竞赛中,GPT-4 Turbo宣称拥有128K tokens,Gemini 1.5 Pro更是达到100万。然而,一个更深层、更隐蔽的问题困扰着个性化AI系统:它们失败不是因为遗忘,而是因为错误地承诺。一项新查看来源专题页arXiv cs.AI 已收录 352 篇文章

时间归档

May 20262079 篇已发布文章

延伸阅读

二值脉冲神经网络破译:SAT求解器为神经形态黑箱注入逻辑之光研究人员首次将二值脉冲神经网络(BSNN)形式化为二值因果模型,利用SAT与SMT求解器为每个神经元的放电生成最小、精确的因果解释。这一神经形态计算与形式化验证的融合,打开了类脑硬件的黑箱,为安全关键应用中的可审计决策铺平道路。多保真数字孪生与LLM:为飞机故障诊断注入“因果灵魂”一项突破性诊断框架利用多保真数字孪生生成罕见故障数据,注入基于FMEA的因果知识,并借助LLM生成自然语言报告——有望终结航空维护领域的“黑箱”时代。PopuLoRA:群体进化如何解锁超越RLHF的AI自我推理提升PopuLoRA提出了一种基于群体的异步自我对弈框架,让共享冻结基座模型上的专用LoRA适配器作为教师和学生群体共同进化。通过用交叉评估取代自我校准,它构建了一个自我强化的循环,不断生成更具挑战性的问题和更优的解决方案,从而打破了传统自我对GRID框架:让大语言模型自动构建安全知识图谱,威胁情报从此结构化GRID提出了一种全新的端到端框架,使大语言模型能够从非结构化的网络威胁情报中自动构建安全知识图谱。其核心在于引入可计算的奖励机制,有效克服了领域知识匮乏与监督信号不足的难题,为安全知识图谱的构建范式带来根本性变革。

常见问题

这篇关于“AI Discovers Physics Without Rules: The 'Baba in Wonderland' Breakthrough”的文章讲了什么?

The fundamental limitation of current AI world models is their tendency to learn superficial semantic correlations—mapping inputs to outputs—rather than the underlying causal laws…

从“Baba in Wonderland world model GitHub implementation”看,这件事为什么值得关注?

The 'Baba in Wonderland' framework tackles a deceptively hard problem: how can an agent learn the true causal dynamics of an environment when it has no prior knowledge of the rules, no language descriptions, and no rewar…

如果想继续追踪“executable world model vs neural world model comparison”,应该重点看什么?

可以继续查看本文整理的原文链接、相关文章和 AI 分析部分,快速了解事件背景、影响与后续进展。