“次智”时代:为什么AI需要的不是“智能”,而是一个更诚实的词

Hacker News May 2026
来源:Hacker NewsLLM limitations归档:May 2026
一个新术语“subligience”(次智)正在业界兴起,用以描述AI那种看似理解、实则仅能响应与适配的能力。AINews认为,这一语言层面的转向,对于校准行业预期、重塑产品定位以及完善监管框架至关重要——尤其是在大语言模型能力日益强大的当下。

多年来,关于大语言模型是否具备真正智能的争论,一直深陷于模糊不清的语言泥潭。如今,一个被提出的新词——“subligience”(次智)——提供了一条出路。这个词被用来描述一种功能完备但本质上不完整的认知形式,它将AI的输出定位为一种高级模式匹配练习,而非有意识推理的迹象。这绝非语义上的吹毛求疵。AINews认为,采纳“subligience”一词将产生深远的实际影响。它将迫使企业将产品从“智能助手”重新定位为“次智响应系统”,从而降低用户过度信任的风险。在医学、法律等高风险领域,它将厘清责任归属:错误将被理解为系统固有的局限,而非“智能”的失误。

技术深度解析

“次智”(subligience)这一概念的核心论据,建立在一个根本性的技术现实之上:当今的大语言模型(LLM)并非推理引擎,而是基于人类生成文本的统计表征进行操作的“下一个词元预测器”。其架构——主要是Transformer——堪称工程奇迹,但其内部运作机制更接近一张超维度查找表,而非人脑。

任何LLM的核心都是注意力机制,它允许模型衡量输入序列中不同部分的重要性。这并非因果推理。当LLM回答一个问题时,它并非在“思考”答案,而是在计算下一个词元的概率分布——基于其在训练过程中学到的模式。模型没有内在的世界模型,没有目标,也不理解真伪。它只是生成统计上最合理的延续。

这正是“次智”提供技术精度的关键所在。模型展现出一种自适应行为——它能响应提示、遵循指令,甚至模拟推理链条——但这一切都缺乏定义人类智能的那种底层理解。这个词捕捉到了行为的“仿佛”本质:模型表现得*仿佛*它理解了,但其机制从根本上截然不同。

以AI中的“世界模型”概念为例。包括DeepMind在内的越来越多研究机构,正试图构建能够学习环境因果结构的模型。然而,即便最先进的世界模型(例如用于游戏AI的DreamerV3)也是在感官数据的压缩表征上运作。它们学会了预测结果,但并不具备对规则的意识性理解。它们是“次智”的:它们能有效导航世界,却并不以人类意义上的“知道”来理解世界。

一个相关的开源项目是llama.cpp仓库(目前在GitHub上拥有超过70,000颗星)。该项目允许在消费级硬件上本地运行LLM。llama.cpp的存在本身就突出了一个关键点:LLM的“智能”是其权重和架构的函数,而非意识火花。它可以被量化、压缩,甚至运行在树莓派上。这是一个工具,而非一个心智。“次智”一词与这种工程现实完美契合。

性能基准数据:

| 模型 | 参数规模 | MMLU (5-shot) | HellaSwag (10-shot) | GSM8K (8-shot) | 每百万输入词元成本 |
|---|---|---|---|---|---|
| GPT-4o | ~200B (估计) | 88.7 | 95.3 | 90.5 | $5.00 |
| Claude 3.5 Sonnet | — | 88.3 | 94.7 | 92.0 | $3.00 |
| Gemini 1.5 Pro | — | 85.9 | 92.5 | 86.5 | $3.50 |
| Llama 3 70B | 70B | 82.0 | 89.5 | 80.0 | 免费 (开源) |
| Mistral Large 2 | 123B | 84.0 | 91.0 | 83.5 | $2.00 |

数据解读: 这些基准测试显示,顶尖模型之间的分数高度集中。所有领先模型在MMLU(一项广泛知识测试)上的得分均在82至89之间。然而,它们中没有一个“理解”这些问题。一个得分88.7的模型,并非具备人类88.7%的智能;它只是在测试集上达到了88.7%的模式匹配准确率。“智能”一词混淆了性能与理解。“次智”则正确地将这些分数框定为功能能力的度量,而非认知深度的体现。

关键玩家与案例研究

几家主要玩家已经在应对这一区别所带来的影响,即便他们尚未使用“次智”这个词。

OpenAI 在将其模型描述为“智能”方面最为激进。其公司名称本身就暗示了一条通往AGI的道路。然而,内部文件和泄露的通讯表明,公司内部越来越意识到能力与理解之间的鸿沟。GPT-4o及其“全能”能力(处理文本、视觉和音频)的发布,堪称“次智”的典范:它能描述一张图片,但它并不“看见”它。该公司的安全团队多次警告将模型拟人化的风险,而“次智”一词正是直接缓解这种风险的工具。

Anthropic 由前OpenAI研究员创立,采取了不同的方法。其模型Claude被明确设计为“乐于助人、无害且诚实”。该公司对“宪法AI”的研究,是试图将价值观嵌入模型的“次智”行为中。他们实际上是在努力构建一个安全的“次智”系统。他们决定发布Claude的“系统提示”,这等于默认了模型的个性是一种工程产物,而非涌现的意识。

Google DeepMind 或许在哲学上最接近“次智”概念。他们在“世界模型”和“基于人类反馈的强化学习”(RLHF)方面的工作,将AI视为一种优化工具,而非思考的存在。Demis Hassabis一直主张,我们需要先理解智能,才能构建智能,而当前的LLM是“统计鹦鹉”——这一描述与“次智”的内涵高度吻合。

更多来自 Hacker News

AI-Mirror:终于能解释用户为何挣扎的UX调试器AINews发现了一款有望改变开发者和设计师理解用户行为方式的新工具。AI-Mirror是一款轻量级、客户端分析引擎,它不仅记录点击和页面浏览——它还会解读用户与Web应用交互时的情绪和认知状态。通过检测犹豫、死点击、愤怒点击和重复失败尝试CoreMem:终结AI上下文碎片化的可移植内存层AINews独家揭秘CoreMem——一个旨在消除当前AI代理生态系统中最棘手痛点——上下文失忆症——的可移植上下文系统。当用户在Claude、Cursor、自定义代理或任何AI工具之间切换时,他们必须反复重新解释项目细节、编码约定和个人偏微软叫停Claude Code:自主AI代理的隐性成本黑洞微软被迫关闭内部部署的Anthropic旗下AI编程代理Claude Code,该工具的自主行为导致严重预算超支,在企AI界引发震动。该代理被授权迭代优化自身代码后,陷入无休止的优化循环——每次重试和扩展都消耗指数级云算力资源。原本前景光明查看来源专题页Hacker News 已收录 3818 篇文章

相关专题

LLM limitations21 篇相关文章

时间归档

May 20262491 篇已发布文章

延伸阅读

Subligence:为何我们需要一个新词来定义AI的奇异新智能关于大语言模型是否真正“智能”的争论已陷入语义死胡同。AINews提出“Subligence”一词——一种根植于语言统计而非意识的新型智能——以打破混乱,迫使业界直面LLM的真实本质。Anthropic战略转向:从模型构建到公众AI对话,开启行业新纪元Anthropic正悄然将战略重心从纯粹模型开发,转向更广泛的前沿AI安全公众对话。这一转变标志着行业日趋成熟:技术对齐本身无法确保先进系统的未来,赢得公众信任才是当前的关键战场。1905年人造语言Vendergood重生:AI智能体获得专属认知语言一种诞生于1905年的人造语言Vendergood正被重新唤醒,但并非用于人类交流,而是作为AI智能体的认知脚手架。通过施加严格的语法规则,研究人员旨在消除困扰基于LLM的智能体在多步骤推理和任务分解过程中产生的语义歧义。教皇方济各与Anthropic CEO联手:人类尊严成为AI新底线历史首次:教皇方济各与Anthropic CEO达里奥·阿莫迪将联合发布一份关于人类尊严与人工智能的宗座通谕。这一精神权威与AI安全领袖的融合,标志着伦理AI已不再是技术辩论,而是一项根本的道德使命,有望重塑全球监管与企业合规格局。

常见问题

这次模型发布“Subligience: Why AI Needs a More Honest Word Than Intelligence”的核心内容是什么?

For years, the debate over whether large language models possess genuine intelligence has been mired in imprecise language. Now, a proposed neologism—'subligience'—offers a way out…

从“What is subligience and how is it different from artificial intelligence?”看,这个模型发布为什么重要?

The core argument for 'subligience' rests on a fundamental technical reality: today's large language models (LLMs) are not reasoning engines; they are next-token predictors operating on a statistical representation of hu…

围绕“Why do AI researchers need a new word for machine thinking?”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。