技术深度解析
“做多AI,做空AGI”这一论点建立在根本性的技术现实之上:驱动当今AI突破的架构,与AGI所需的架构截然不同。当前的大语言模型(LLM),如GPT-4、Claude 3.5和Gemini 1.5,都基于Transformer架构——一种擅长模式匹配但缺乏真正推理、规划或因果理解的序列到序列模型。
规模化的天花板: 主流范式一直是规模化计算、数据和参数。然而,来自多个实验室的最新研究显示,回报正在递减。从GPT-2到GPT-4一直成立的“规模化定律”,如今正显现出饱和迹象。例如,MMLU基准测试——一项衡量广泛知识掌握程度的标准——其分数提升已从每代模型10多分的跃升,放缓至2到3分。下表展示了这一趋势在主要模型中的体现:
| 模型 | 参数 | MMLU分数 | 训练计算量(FLOPs) | 年份 |
|---|---|---|---|---|
| GPT-3 | 175B | 43.9 | 3.14e23 | 2020 |
| GPT-4 | ~1.8T(估计) | 86.4 | 2.1e25 | 2023 |
| GPT-4o | ~200B(估计) | 88.7 | 1.0e25 | 2024 |
| Claude 3.5 Sonnet | — | 88.3 | — | 2024 |
| Gemini 1.5 Pro | — | 85.9 | — | 2024 |
| Llama 3 405B | 405B | 87.8 | 3.8e24 | 2024 |
数据要点: GPT-4o与Llama 3 405B之间的MMLU分数差距不到1分,尽管两者参数相差2倍,训练预算也大相径庭。这表明,纯粹的规模化正在触及天花板;进一步的提升需要架构创新,而不仅仅是更大的模型。
AGI的鸿沟: AGI至少需要当前架构所缺乏的三项突破:
1. 因果推理: 当前模型是关联性的,而非因果性的。它们无法理解某事“为什么”发生,只能基于统计模式预测下一个词元。
2. 长期规划: Transformer的上下文窗口有限(即使拥有100万以上的词元上下文,它们在多步骤规划任务上仍然表现挣扎)。
3. 能源效率: 单次GPT-4训练运行估计消耗50 GWh——相当于5000个美国家庭一年的用电量。AGI所需的能源将高出数个数量级。
开源信号: 开源社区也在用代码投票。像llama.cpp(超过6万星标)这样的仓库专注于高效的本地推理,而非AGI。vLLM(超过3万星标)优化了生产环境下的服务吞吐量。LangChain(超过9万星标)则致力于将LLM串联起来用于实际应用。这些都不是AGI项目;它们是为狭义AI部署提供的基础设施。
关键玩家与案例研究
市场对狭义AI的偏好,体现在主要玩家的战略以及垂直领域初创公司的成功之中。
OpenAI: 尽管其使命是AGI,但OpenAI最赚钱的产品是ChatGPT——一个狭义的对话式AI。其收入模式依赖于订阅以及用于编程、写作和客户支持的API使用。该公司已悄然从“面向所有人的AGI”转向“企业级AI工具”。其GPT Store和自定义GPT明确针对垂直应用。
Anthropic: 虽然创立时专注于AGI安全,但Anthropic的Claude如今主要面向企业用例进行营销:文档分析、代码生成和客户服务。其“宪法式AI”方法旨在让狭义AI更安全,而非构建AGI。
垂直AI初创公司: 真正的行动发生在垂直领域。例如:
| 公司 | 垂直领域 | 产品 | 估值(估计) | 收入模式 |
|---|---|---|---|---|
| GitHub Copilot | 代码生成 | AI结对编程 | 100亿美元以上(微软) | 订阅(10-39美元/用户/月) |
| Recursion Pharmaceuticals | 药物发现 | AI驱动的分子设计 | 50亿美元以上 | 合作+授权 |
| Jasper | 营销内容 | AI文案撰写 | 15亿美元 | 订阅(49-499美元/月) |
| Harvey | 法律 | 面向律所的AI | 7亿美元 | 订阅 |
| Abridge | 医疗保健 | 医疗笔记 | 5亿美元 | 按次收费 |
数据要点: 这些公司拥有清晰、可衡量的投资回报率。GitHub Copilot声称能让开发者的编码速度提升55%。Recursion已识别出超过100个药物靶点。Harvey将法律研究时间减少了70%。投资者可以计算出回报——这在AGI领域是不可能的。
AGI怀疑论者: 像Yann LeCun(Meta首席AI科学家)这样的知名人物已公开表示,当前架构永远无法通向AGI。LeCun倡导“世界模型”和替代方法。同样,Gary Marcus一直认为,仅靠深度学习是不够的。这些声音在投资圈中正获得越来越多的关注。
行业影响与市场动态
“做多AI,做空AGI”这一论点正在重塑整个AI生态系统。
资金重新分配: 2024年,AI初创公司全球融资500亿美元。其中,70%流向了垂直应用(医疗、法律、金融、代码),20%流向了基础设施(计算、数据、工具),仅有10%流向了“AGI相关”研究。这与2022-2023年相比是一个巨大的转变,当时基础模型公司