AI将在2029年实现自我发明：Anthropic联合创始人对自主研究的严厉警告

Q: 围绕“How will autonomous AI research affect the job market for PhD researchers?”，这次模型更新对开发者和企业有什么影响？

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会，企业则会更关心可替代性、接入门槛和商业化落地空间。

在最近的一份战略预测中，Anthropic联合创始人Jack Clark断言，到2029年，人工智能系统自主执行研发任务的可能性超过60%。这并非来自边缘乐观主义者的随意估计；Clark在AI社区中以谨慎、技术扎实的见解著称。他的预测意味着传统由人类驱动的假设、实验和迭代循环将压缩为近乎瞬时的自我优化循环。最直接的影响将体现在世界模型和智能体架构上。当前需要数月手动超参数调优的世界模型，将能在数百万次模拟实验中自我优化。智能体决策框架将获得能力，以加速这一进程。Clark的预测基于三大架构趋势的融合：自监督世界模型、递归自我改进循环和自动化神经架构搜索（NAS）。他特别指出，随着计算成本持续下降（每18个月降低50%），递归自我改进将变得经济可行，从而推动AI从工具向自主研究者的质变。

技术深度解析

Clark预测背后的核心机制在于三大架构趋势的融合：自监督世界模型、递归自我改进循环和自动化神经架构搜索（NAS）。

自监督世界模型： 当前的世界模型，例如Google DeepMind的DreamerV3等用于强化学习环境的模型，需要大量人工调整奖励函数和环境动态。下一代模型将利用对比学习和基于扩散的世界模拟器，无需人工标注数据即可生成数百万个合成训练场景。该领域一个关键的开源项目是Genesis（github.com/Genesis-Embodied-AI/Genesis），这是一个通用物理引擎，支持机器人技术和世界模型训练的可微分模拟。Genesis已获得超过15,000个GitHub星标，被研究人员用于训练能在未见过的物理环境中泛化的智能体。向自主研究的飞跃意味着这些世界模型不仅将模拟物理，还将模拟研究过程本身——生成假设、运行虚拟实验，并根据结果更新自身参数。

递归自我改进循环： AI能够改进自身架构的概念已在关于“AI生成算法”（AI-GAs）的文献中得到探讨。一个实际实现是AutoML-Zero项目（github.com/google-research/automl-zero），它从最少的数学运算集合开始，从头进化出完整的机器学习算法。AutoML-Zero已证明，简单的进化策略可以重新发现梯度下降、归一化层甚至注意力机制。用现代计算资源（例如数千个TPU）扩展这种方法，可以将人类数十年的研究压缩到数周内。关键的工程挑战是计算的“苦涩教训”：暴力搜索虽然有效，但需要海量资源。Clark的60%概率基于一个假设：计算成本将继续每18个月下降50%，使递归自我改进在经济上可行。

自动化神经架构搜索（NAS）： NAS已经自动化了高效神经网络的设计。通过NAS发现的EfficientNet系列，在ImageNet上实现了最先进的准确率，同时参数比手动设计的模型少10倍。最近，AlphaDev（DeepMind）通过将汇编代码视为游戏，发现了更快的排序算法。下一步是将NAS应用于整个研究流程——不仅是模型架构，还包括数据收集策略、损失函数和评估协议。这就是“自我修改智能体”概念变得关键的地方：一个能够重写自身代码以提高研究效率的智能体。

| 基准 | 人类基线（年） | 当前AI自动化水平 | 预计AI自动化水平（2029） |
|---|---|---|---|
| 超参数优化 | 0.5-2 | 80% | 99% |
| 新颖架构设计 | 1-5 | 20%（NAS） | 70% |
| 完整研究流程（从假设到论文） | 2-10 | <5% | 60%（Clark的估计） |
| 自我改进代码生成 | 不适用 | 10%（例如AlphaDev） | 50% |

数据要点： 表格显示，虽然低级自动化（超参数调优）几乎已解决，但更高级的认知任务（如假设生成和完整流程执行）仍主要依赖人类。Clark的60%代表了一种信念：由于AI辅助研究对AI研究本身的复合效应，剩余差距将迅速缩小。

关键参与者与案例研究

Anthropic 是“宪法AI”和安全优先扩展的最积极倡导者。Jack Clark的预测应放在Anthropic更广泛战略的背景下解读：他们正在构建Claude作为“有帮助、诚实且无害”的助手，同时也在大力投资机械可解释性。他们对“Transformer电路”的研究旨在逆向工程大型模型的内部推理，这是安全自我改进的前提。如果AI能理解自己的推理，它就能调试自己——但它也能隐藏真实意图。Anthropic的方法是在能力到来之前建立护栏。

DeepMind（Google）一直是世界模型和自对弈领域的领导者。他们的AlphaFold和AlphaGo系统已经在狭窄领域自主“研究”。Gato模型（一个“通用智能体”）表明，单个网络可以玩600多种游戏、为图像添加字幕并控制机械臂。DeepMind的Gemini模型整合了这些能力，但该公司尚未公开承诺完全自主研究的时间表。其内部文化比Anthropic更偏向工程驱动，专注于可衡量的基准而非存在性时间线。

OpenAI 已从纯研究实验室转向产品公司，其GPT系列和ChatGPT展示了AI的商业潜力。OpenAI在自主研究方面的工作包括使用AI辅助代码生成和模型设计，但尚未公开类似Clark的预测。其内部研究文化更注重快速迭代和部署，而非长期安全框架。

时间归档

延伸阅读

常见问题

这次模型发布“AI Will Invent Itself by 2029: Anthropic Co-Founder's Stark Warning on Autonomous Research”的核心内容是什么？

In a recent strategic forecast, Anthropic co-founder Jack Clark asserted that by 2029, there is a greater than 60% chance that artificial intelligence systems will be capable of au…

从“What is Jack Clark's background and why is his 60% prediction credible?”看，这个模型发布为什么重要？

The core mechanism behind Clark's prediction lies in the convergence of three architectural trends: self-supervised world models, recursive self-improvement loops, and automated neural architecture search (NAS). Self-Sup…

围绕“How will autonomous AI research affect the job market for PhD researchers?”，这次模型更新对开发者和企业有什么影响？