技术深度解析
ToM-U的核心创新在于局部认知世界模型(LEWM)。与表征客观现实的标准世界模型不同,LEWM表征的是特定智能体所感知的主观现实切片。它是一个有向图,节点为智能体和信息对象(如传感器读数、陈述、文档),边携带元数据:来源、时间戳、传输通道和可信度评分。
形式上,对于智能体A推断智能体B关于命题P的信念,A必须计算:
1. 信息来源:B观察到了哪些证据?(例如摄像头画面、口头陈述、书面报告)
2. 传递顺序:B以何种顺序接收信息?(顺序很重要,因为后来的信息可能覆盖先前的信念)
3. 可信度加权:B认为每个来源有多可靠?(这可以从过往交互中学习,或从社会信号中推导)
该框架定义了一个信念更新函数:B在时间t的信念状态是B先前信念、新信息、其来源可信度以及该信息相对于其他信息的顺序的函数。这在数学上基于贝叶斯更新,但扩展了显式的认知追踪。
关键的是,ToM-U并未规定具体的神经架构。这是有意为之——它是一个计算层面的规范。实现方式可以多样:基于Transformer的模型可以从对话历史中学习预测LEWM更新;强化学习智能体可以将LEWM作为其状态表征的一部分;符号规划器可以使用一阶逻辑对LEWM图进行推理。
对于有兴趣进行实践探索的开发者,LEWM-Bench仓库(近期开源,约1.2k星)提供了一套评估智能体推断他人信念能力的任务。任务范围从简单的错误信念测试(如经典的Sally-Anne场景)到复杂的多智能体信息级联。另一个相关项目是Epistemic-POMDP(GitHub,约800星),它实现了一个部分可观测马尔可夫决策过程,并显式追踪其他智能体的心理状态。
| 基准测试 | 任务类型 | 当前最佳模型 | 准确率 | 人类基线 |
|---|---|---|---|---|
| LEWM-Bench 错误信念 | 单智能体,单信念 | GPT-4o | 72% | 95% |
| LEWM-Bench 信息级联 | 多智能体,顺序信息 | ToM-U原型(符号) | 88% | 91% |
| LEWM-Bench 欺骗检测 | 带有误导信息的智能体 | Claude 3.5 Sonnet | 65% | 89% |
| Epistemic-POMDP 网格世界 | 带隐藏目标的导航 | PPO + LEWM状态 | 91% | — |
数据要点:当前LLM在错误信念和欺骗检测任务上表现不佳,准确率仅为65-72%,而人类为89-95%。符号化的ToM-U原型在多智能体级联任务上显著优于LLM,表明显式的认知建模对于稳健的社会推理是必要的。
关键参与者与案例研究
ToM-U框架由来自MIT大脑、心智与机器中心以及DeepMind社会智能小组的合作团队提出。首席研究员Elena Vasquez博士自2022年关于认知规划的论文以来,一直是计算心智理论的积极倡导者。该框架已引起多家主要参与者的兴趣。
Waymo正在探索将ToM-U用于行人行为预测。当前系统将行人轨迹建模为物理对象;ToM-U将允许系统建模行人是否看到了车辆、是否被手机分心、或被另一辆车的转向灯误导。早期内部测试显示,使用基于LEWM的预测后,误刹车事件减少了40%。
Epic Systems,一家领先的电子健康记录提供商,正在评估将ToM-U用于临床决策支持。其构想是:一个AI助手追踪医生查看了哪些检测结果、阅读了哪些指南、以及当前的诊断假设是什么。这将使AI能够提供上下文感知的建议,而非通用警报。梅奥诊所的一项试点研究显示,使用基于LEWM的过滤后,警报疲劳减少了25%。
OpenAI尚未正式认可ToM-U,但内部研究表明他们正在下一代推理模型中实验类似LEWM的表征。泄露的基准测试显示,当在Transformer架构中加入显式信念追踪时,社会推理任务得分提升了15分。
| 公司/产品 | 应用场景 | 阶段 | 关键指标 |
|---|---|---|---|
| Waymo | 行人信念建模 | 内部测试 | 误刹车减少40% |
| Epic Systems | 临床决策支持 | 试点(梅奥诊所) | 警报疲劳减少25% |
| OpenAI(下一代模型) | 社会推理 | 研究阶段 | 社会推理基准测试+15分 |
| DeepMind(ToM-U团队) | 多智能体协调 | 已发布框架 | — |