哈萨比斯警告:AI是否已走上偏离真正智能的“危险捷径”?

DeepMind联合创始人德米斯·哈萨比斯近日发出尖锐批评,将ChatGPT所代表的大语言模型主流路径称为人工智能真正目标的“危险偏离”。这一警告引爆了关于AI发展根本方向的论战:纯粹依赖统计关联的规模扩展能否实现真正理解?

人工智能领域正面临一场深刻的哲学与技术路线分裂,DeepMind联合创始人德米斯·哈萨比斯的最新批判将此推至聚光灯下。他将当前以ChatGPT、Claude和Gemini为代表的大规模语言模型范式,直指为追求真正智能道路上的潜在死胡同。哈萨比斯指出,这些系统虽然展现出令人惊叹的流畅性,但本质仍是基于统计关联的复杂模式匹配器,缺乏对世界运行机制的内在建模能力。它们无法像人类或真正智能体那样理解因果关系、物理规律或时间维度,导致其容易产生幻觉、规划能力不可靠,且在训练数据之外的陌生情境中表现脆弱。这一批判触及了AI研究的核心矛盾:我们究竟是在创造理解世界的智能,还是仅仅构建了更精妙的“随机鹦鹉”?随着科技巨头在两条路径上投入巨额资源,这场辩论将深刻影响未来十年AI技术的发展轨迹与伦理边界。

技术深度解析

这场辩论的核心在于大语言模型与世界模型在架构与学习范式上的根本差异。

LLM:关联引擎
以GPT-4、Claude 3和Llama 3为代表的现代大语言模型基于Transformer架构,通过海量文本与代码的下一词元预测进行训练,学习序列的概率分布。其“知识”实则是词元间极度复杂的统计关联网络。当被问及“如果把玻璃杯推下桌子会怎样?”时,模型生成“玻璃杯会掉落破碎”的合理答案,并非因为它模拟了物理过程,而是该序列在其训练数据的前后语境中具有高概率。这种方法产生了惊人的流畅性和广泛( albeit 浅层)的理解模仿能力。关键局限包括:
- 缺乏根基性:与感知运动经验无连接
- 认知盲区:无法区分已知与未知,会以高置信度虚构(幻觉)信息
- 静态知识:知识在训练时冻结,更新需昂贵重训练

世界模型:因果模拟器
哈萨比斯倡导并在强化学习与具身AI研究中推进的世界模型路径,旨在构建环境的内化可操作模型。世界模型通常是能根据当前状态与动作预测环境未来状态的神经网络。例如DeepMind的DreamerV3——这是一个基于模型的强化学习智能体,它从像素中学习世界模型,并完全在其潜在空间内通过模拟未来轨迹进行规划。它不仅预测下一个词,更预测行动的后果。这需要学习能捕捉物体本质、动力学特性及其交互的压缩表征。

体现该研究的典型GitHub仓库是`danijar/dreamerv3`。这个TensorFlow/JAX实现已获超3.5k星标,展示了仅用像素数据和单一超参数集,在从2D游戏到3D机器人模拟的多元领域达到顶尖性能。其成功证明了通用可扩展世界模型的潜力。

| 维度 | 大语言模型 | 世界模型(如DreamerV3) |
| :--------------- | :--------------------------------- | :------------------------------------- |
| 主要输入 | 离散词元(文本/代码) | 连续感知数据(像素、本体感觉) |
| 学习目标 | 下一词元预测(最大化似然) | 未来状态预测/奖励最大化 |
| 核心能力 | 统计关联与模式补全 | 环境中的因果推理与规划 |
| 知识更新 | 重训练/微调 | 支持在线学习 |
| 典型基准 | MMLU(知识)、HumanEval(编程) | Atari 100K、DMLab、机器人操控 |
| 关键缺陷 | 幻觉、缺乏根基性 | 样本效率低、领域特异性强 |

数据启示:上表揭示了一个根本二分法——LLM擅长压缩和生成以语言表达的人类知识,而世界模型擅长在动态系统中学习与规划。它们是针对智能不同维度的互补范式。

关键参与者与案例研究

AI生态已分化为重度投入LLM规模扩展范式的公司,与追求以推理和世界模型为核心的混合或替代路径的阵营。

LLM规模扩展先锋
- OpenAI:规模假设的原型。从GPT-3到GPT-4,其战略始终是扩大模型规模、数据与算力,赌定推理等能力会“涌现”。其产品ChatGPT是此路径的公众面孔。
- Anthropic:通过宪法AI与机制可解释性聚焦于提升LLM的可靠性与可控性,本质上试图从内部“修复”LLM范式的局限。
- Meta (FAIR):凭借Llama 3推动开源高效LLM,在民主化访问的同时强化了“文本即基础”的模型理念。

世界模型与混合路径倡导者
- DeepMind (Google):在哈萨比斯领导下,DeepMind的基因建立在世界模型与强化学习之上。AlphaGo的树搜索是在游戏模型内进行规划的一种形式;AlphaFold 2预测蛋白质结构——实为分子层面的物理世界模型。其最近的Gemini模型家族,特别是拥有超大上下文窗口的Gemini 1.5 Pro,代表了将部分规划与多模态根基性整合到以LLM为主架构中的尝试,这是内部融合的明确信号。
- xAI:埃隆·马斯克的公司凭借Grok-1模型强调求真与实时知识获取,间接承认了纯LLM的静态知识缺陷。
- **Cogn[未完待续]

延伸阅读

AGI已然降临:下一前沿是自我进化的AI系统一位顶尖AI研究者提出颠覆性观点:人工通用智能(AGI)并非未来里程碑,而是既成现实。她指出,真正的技术边疆在于让AGI实现“自我进化”——自主改进其架构与能力。这一范式转变将彻底重写AI发展路线图。大模型幻灭时刻:为何AI的通用智能承诺依然落空一股清醒反思的浪潮正在冲击AI炒作周期。当图像与视频生成器令人目眩时,大型语言模型却在推理与现实交互中暴露出深刻局限。这种日益增长的幻灭感,揭示了当今模式匹配引擎与承诺中的人工通用智能黎明之间的根本鸿沟。超越令牌定价战:AI巨头如何构建真实世界价值当降低令牌价格的竞赛触及天然极限,人工智能产业正经历根本性转型。领先企业正将竞争焦点从‘每令牌成本’转向‘每输出价值’,聚焦可靠性、推理能力与实际问题解决。这标志着AI必须交付可衡量商业影响的新时代已然开启。人形机器人迎来商业化黎明,但盈利之路依然漫长人形机器人行业正迎来关键转折点,头部企业纷纷宣布斩获首批重要商业订单。然而,这缕商业曙光仍被持续巨额亏损所笼罩,揭示了尖端硬件规模化背后残酷的经济现实。

常见问题

这次模型发布“Demis Hassabis's Warning: Has AI Taken a Dangerous Shortcut Away from True Intelligence?”的核心内容是什么?

The artificial intelligence community is grappling with a profound philosophical and technical schism, brought into sharp focus by DeepMind co-founder Demis Hassabis. His recent cr…

从“difference between world model and large language model”看,这个模型发布为什么重要?

The core of the debate lies in the architectural and learning paradigm differences between Large Language Models (LLMs) and World Models. LLMs: The Correlation Engine. Modern LLMs like GPT-4, Claude 3, and Llama 3 are ba…

围绕“Demis Hassabis critique of ChatGPT technical details”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。