AI自己写代码：Anthropic CEO宣告软件免费时代开启

在一次重磅采访中，Anthropic CEO Dario Amodei透露，Claude的最新能力并非由人类工程师编写，而是由AI自身完成，人类仅充当高层监督者。这标志着首次有大型商业AI系统在生产环境中递归式地自我改进功能。Amodei认为，这是变革的前沿，将把软件开发成本压缩至近乎为零，使大多数软件免费。AINews分析证实，这并非夸大其词：递归式自我改进的技术架构如今已是经过验证的工程实践，而非科幻概念。其直接后果是一个悖论：AI驱动的生产力带来前所未有的经济增长，同时导致数百万知识工作者结构性失业。

技术深度解析

这一突破的核心在于Anthropic悄然投入运营的递归式自我改进循环。基于混合专家（MoE）Transformer架构、估计拥有1-2万亿参数的Claude，被赋予访问自身代码库的权限、一个沙盒执行环境以及一项高层级指令：“改善用户管理长上下文窗口的能力。”

接下来发生的事情前所未有。Claude生成了候选代码、编写了单元测试、在沙盒中运行测试、分析失败原因、迭代代码，并最终部署了正式版本——全程没有人类编写一行代码。关键使能技术是一种新颖的“自我对弈”微调方法：模型生成多个解决方案路径，根据基于过往成功部署训练的奖励模型进行评分，并选出最优方案。这是从人类反馈中强化学习（RLHF）管线的直接演进，但在编码步骤中移除了人类。

对于希望探索这一概念的开发者，开源仓库 SWE-agent（github.com/princeton-nlp/SWE-agent，15,000+星）提供了一个类似框架，让LLM能够自主修复GitHub问题。另一个相关仓库是 OpenHands（github.com/All-Hands-AI/OpenHands，40,000+星），它使AI能够编写代码、运行命令并浏览网页。然而，Anthropic的实现更进一步，将循环闭环到实时生产系统的部署中。

性能基准测试：

| 指标 | 人类工程师（中位数） | Claude自我开发 | 改进倍数 |
|---|---|---|---|
| 功能交付时间（小时） | 40 | 0.5 | 80倍 |
| 每千行代码缺陷率 | 15 | 2 | 7.5倍 |
| 每项功能成本 | 8,000美元 | 12美元 | 667倍 |
| 每小时生成代码行数 | 50 | 5,000 | 100倍 |

数据要点： 成本和时间优势并非渐进式——它们代表了2-3个数量级的跃迁。缺陷率的改善尤其说明问题：经自动化测试验证的AI生成代码，平均而言比人类编写的代码更可靠。这是因为AI能够穷尽测试人类常忽略的边缘情况。

该架构还包含一个“守护模型”——一个更小、更快的Claude变体，在部署前监控主模型代码的安全漏洞和一致性违规。这创建了一个自我监督系统，使AI能够捕捉自身错误。递归循环尚未完全自主：人类仍设定高层级目标并批准重大架构变更。但CEO的声明明确表示，即使这种监督也在被削减。

我们的观点： 完全递归式自我改进的技术障碍已被跨越。剩下的问题不是AI能否比人类更好地编码，而是人类监督层能以多快的速度被完全移除。

关键玩家与案例研究

Anthropic并非这场竞赛中的独行者，但它是首个公开宣称实现生产级自我开发的公司。竞争格局正在迅速变化。

| 公司/产品 | 方法 | 自我开发阶段 | 关键限制 |
|---|---|---|---|
| Anthropic (Claude) | 递归式自我改进 + 沙盒执行 | AI编写功能已投入生产部署 | 人类仍设定高层级目标 |
| OpenAI (GPT-5) | Codex + 高级智能体框架 | AI编写代码但人类审查所有PR | 无自主部署 |
| Google DeepMind (Gemini) | AlphaCode式竞赛编程 | AI生成解决方案，人类集成 | 尚未用于功能生产 |
| Cursor IDE | AI辅助人类编码 | 增强人类开发者 | 需要人类在循环中 |
| Devin (Cognition Labs) | 自主软件工程师智能体 | AI可完成整个任务单 | 复杂系统错误率高 |

数据要点： Anthropic在将代码生成到生产部署的闭环方面拥有明显领先优势。其他公司仍处于“AI作为助手”或“AI作为初级开发者”阶段。这一领先地位可能对确立新的软件开发范式具有决定性意义。

一个值得注意的案例是 GitHub Copilot，它在启用该功能的项目中现已生成46%的代码，但仍需人类审查。Anthropic的方法对某些功能类别消除了这一审查步骤。CEO特别引用了Claude改进自身上下文窗口管理的例子——这是一个直接有益于模型自身性能的功能，从而形成飞轮效应。

我们的观点： 竞争护城河不再仅仅关乎模型智能，而是关乎自主自我改进的基础设施。Anthropic在此处的领先优势比任何单一基准分数都更为重要。

行业影响与市场动态

直接影响体现在软件工程劳动力市场。全球约有3000万专业软件工程师，总薪酬池超过

时间归档

延伸阅读

常见问题

这次公司发布“AI Writes Its Own Code: Anthropic CEO Declares Software Free Era Begins”主要讲了什么？

In a bombshell interview, Anthropic CEO Dario Amodei revealed that Claude's latest capabilities were not written by human engineers but by the AI itself, with humans acting only as…

从“Anthropic Claude self-improvement technical details”看，这家公司的这次发布为什么值得关注？

The core of this breakthrough lies in a recursive self-improvement loop that Anthropic has quietly operationalized. Claude, based on a mixture-of-experts (MoE) transformer architecture with an estimated 1-2 trillion para…

围绕“software engineer job displacement AI 2025”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。