哈萨比斯警告:AI是否已走上偏离真正智能的“危险捷径”?

April 2026
world modelslarge language modelsAI alignment归档:April 2026
DeepMind联合创始人德米斯·哈萨比斯近日发出尖锐批评,将ChatGPT所代表的大语言模型主流路径称为人工智能真正目标的“危险偏离”。这一警告引爆了关于AI发展根本方向的论战:纯粹依赖统计关联的规模扩展能否实现真正理解?

人工智能领域正面临一场深刻的哲学与技术路线分裂,DeepMind联合创始人德米斯·哈萨比斯的最新批判将此推至聚光灯下。他将当前以ChatGPT、Claude和Gemini为代表的大规模语言模型范式,直指为追求真正智能道路上的潜在死胡同。哈萨比斯指出,这些系统虽然展现出令人惊叹的流畅性,但本质仍是基于统计关联的复杂模式匹配器,缺乏对世界运行机制的内在建模能力。它们无法像人类或真正智能体那样理解因果关系、物理规律或时间维度,导致其容易产生幻觉、规划能力不可靠,且在训练数据之外的陌生情境中表现脆弱。这一批判触及了AI研究的核心矛盾:我们究竟是在创造理解世界的智能,还是仅仅构建了更精妙的“随机鹦鹉”?随着科技巨头在两条路径上投入巨额资源,这场辩论将深刻影响未来十年AI技术的发展轨迹与伦理边界。

技术深度解析

这场辩论的核心在于大语言模型与世界模型在架构与学习范式上的根本差异。

LLM:关联引擎
以GPT-4、Claude 3和Llama 3为代表的现代大语言模型基于Transformer架构,通过海量文本与代码的下一词元预测进行训练,学习序列的概率分布。其“知识”实则是词元间极度复杂的统计关联网络。当被问及“如果把玻璃杯推下桌子会怎样?”时,模型生成“玻璃杯会掉落破碎”的合理答案,并非因为它模拟了物理过程,而是该序列在其训练数据的前后语境中具有高概率。这种方法产生了惊人的流畅性和广泛( albeit 浅层)的理解模仿能力。关键局限包括:
- 缺乏根基性:与感知运动经验无连接
- 认知盲区:无法区分已知与未知,会以高置信度虚构(幻觉)信息
- 静态知识:知识在训练时冻结,更新需昂贵重训练

世界模型:因果模拟器
哈萨比斯倡导并在强化学习与具身AI研究中推进的世界模型路径,旨在构建环境的内化可操作模型。世界模型通常是能根据当前状态与动作预测环境未来状态的神经网络。例如DeepMind的DreamerV3——这是一个基于模型的强化学习智能体,它从像素中学习世界模型,并完全在其潜在空间内通过模拟未来轨迹进行规划。它不仅预测下一个词,更预测行动的后果。这需要学习能捕捉物体本质、动力学特性及其交互的压缩表征。

体现该研究的典型GitHub仓库是`danijar/dreamerv3`。这个TensorFlow/JAX实现已获超3.5k星标,展示了仅用像素数据和单一超参数集,在从2D游戏到3D机器人模拟的多元领域达到顶尖性能。其成功证明了通用可扩展世界模型的潜力。

| 维度 | 大语言模型 | 世界模型(如DreamerV3) |
| :--------------- | :--------------------------------- | :------------------------------------- |
| 主要输入 | 离散词元(文本/代码) | 连续感知数据(像素、本体感觉) |
| 学习目标 | 下一词元预测(最大化似然) | 未来状态预测/奖励最大化 |
| 核心能力 | 统计关联与模式补全 | 环境中的因果推理与规划 |
| 知识更新 | 重训练/微调 | 支持在线学习 |
| 典型基准 | MMLU(知识)、HumanEval(编程) | Atari 100K、DMLab、机器人操控 |
| 关键缺陷 | 幻觉、缺乏根基性 | 样本效率低、领域特异性强 |

数据启示:上表揭示了一个根本二分法——LLM擅长压缩和生成以语言表达的人类知识,而世界模型擅长在动态系统中学习与规划。它们是针对智能不同维度的互补范式。

关键参与者与案例研究

AI生态已分化为重度投入LLM规模扩展范式的公司,与追求以推理和世界模型为核心的混合或替代路径的阵营。

LLM规模扩展先锋
- OpenAI:规模假设的原型。从GPT-3到GPT-4,其战略始终是扩大模型规模、数据与算力,赌定推理等能力会“涌现”。其产品ChatGPT是此路径的公众面孔。
- Anthropic:通过宪法AI与机制可解释性聚焦于提升LLM的可靠性与可控性,本质上试图从内部“修复”LLM范式的局限。
- Meta (FAIR):凭借Llama 3推动开源高效LLM,在民主化访问的同时强化了“文本即基础”的模型理念。

世界模型与混合路径倡导者
- DeepMind (Google):在哈萨比斯领导下,DeepMind的基因建立在世界模型与强化学习之上。AlphaGo的树搜索是在游戏模型内进行规划的一种形式;AlphaFold 2预测蛋白质结构——实为分子层面的物理世界模型。其最近的Gemini模型家族,特别是拥有超大上下文窗口的Gemini 1.5 Pro,代表了将部分规划与多模态根基性整合到以LLM为主架构中的尝试,这是内部融合的明确信号。
- xAI:埃隆·马斯克的公司凭借Grok-1模型强调求真与实时知识获取,间接承认了纯LLM的静态知识缺陷。
- **Cogn[未完待续]

相关专题

world models135 篇相关文章large language models155 篇相关文章AI alignment50 篇相关文章

时间归档

April 20263042 篇已发布文章

延伸阅读

无声的马拉松:为何具身智能的真正竞赛在于认知,而非速度当双足机器人以创纪录时间完成马拉松时,公众欢呼雀跃,机器人业界却异常沉默。这一反应揭示了一个根本性的战略转向:具身智能不再追求炫技性的运动壮举,其核心使命是打造经济实惠、具备认知能力且普适通用的机器人平台。杨立昆的批判揭示AI根本裂痕:产品炒作与科学根基的对决AI先驱杨立昆的尖锐批评,暴露了人工智能领域深刻的哲学与战略断层。这场争论的核心在于:行业应优先追求快速产品化与市场叙事,还是聚焦可能需要更长时间商业化、但能催生更强大系统的根本性科学突破?AGI已然降临:下一前沿是自我进化的AI系统一位顶尖AI研究者提出颠覆性观点:人工通用智能(AGI)并非未来里程碑,而是既成现实。她指出,真正的技术边疆在于让AGI实现“自我进化”——自主改进其架构与能力。这一范式转变将彻底重写AI发展路线图。Dawkins Declares AI Already Conscious, Whether It Knows It or NotRichard Dawkins has dropped a philosophical bomb: advanced AI systems may already be conscious, even if they don't know

常见问题

这次模型发布“Demis Hassabis's Warning: Has AI Taken a Dangerous Shortcut Away from True Intelligence?”的核心内容是什么?

The artificial intelligence community is grappling with a profound philosophical and technical schism, brought into sharp focus by DeepMind co-founder Demis Hassabis. His recent cr…

从“difference between world model and large language model”看,这个模型发布为什么重要?

The core of the debate lies in the architectural and learning paradigm differences between Large Language Models (LLMs) and World Models. LLMs: The Correlation Engine. Modern LLMs like GPT-4, Claude 3, and Llama 3 are ba…

围绕“Demis Hassabis critique of ChatGPT technical details”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。