Peter Norvig 加入 Recursive:40亿美元豪赌AI自我进化,颠覆参数 scaling 范式

Hacker News May 2026
来源:Hacker NewsAI alignment归档:May 2026
传奇计算机科学家、《人工智能:一种现代方法》合著者 Peter Norvig 正式加盟 Recursive——一家手握40亿美元、致力于打造可递归自我改进AI系统的神秘初创公司。这标志着AI行业从单纯扩大参数规模,向自主自我进化方向的根本性转变,其影响深远。

Peter Norvig,这位曾担任谷歌研究总监、合著了AI领域奠基性教材《人工智能:一种现代方法》的传奇计算机科学家,现已正式加入 Recursive——一家筹集了惊人40亿美元、旨在构建能够递归自我改进的AI系统的神秘初创公司。与依赖扩大模型规模、数据量或算力的传统方法不同,Recursive 的目标是创建一个闭环系统:AI 能够识别自身算法中的缺陷,设计架构升级,并在无需人类干预的情况下实施这些改进。这并非自动超参数调优或基于人类反馈的强化学习,而是让 AI 从根本上重写自身代码、改进自身架构。Norvig 的加入为这一雄心勃勃的计划提供了深厚的可信度与行业背书。

技术深度解析

Recursive 的核心论点是:当前 scaling 参数、数据和算力的范式正遭遇收益递减。该公司正在构建一个所谓的“自我修改认知架构”——一个系统,其中 AI 可以分析自身性能,识别其神经网络设计中的瓶颈,并生成新代码来替换或增强自身组件。这与 AutoML 或神经架构搜索(NAS)有本质区别,后者通常在一个预定义操作的固定空间内进行搜索。Recursive 的方法旨在通过允许 AI 编写新的操作、新的激活函数、新的注意力机制,甚至新的训练算法,来扩展搜索空间本身。

架构概览:

Recursive 系统的核心是一个元控制器(meta-controller),这是一个独立的模型,用于监控主模型的性能。元控制器结合了程序合成和强化学习来提出修改建议。其关键创新在于一个“安全执行沙盒”(safe execution sandbox),在该沙盒中,提议的更改会在部署前于模拟环境中进行测试。该沙盒使用形式化验证技术来检查灾难性故障模式,例如梯度爆炸、神经元死亡或无限循环。

递归循环:
1. 监控: 主模型处理任务并记录其内部状态、梯度和注意力模式。
2. 分析: 元控制器识别出次优模式,例如坍塌的注意力头、饱和的层,或变得过于尖锐的损失景观。
3. 提议: 元控制器生成一个代码补丁——一段 Python 或 CUDA 代码片段——用于修改模型架构。例如,它可能将标准的前馈层替换为混合专家层,或插入一种新的归一化技术。
4. 验证: 该补丁在沙盒中针对一套基准测试和安全约束进行测试。
5. 部署: 如果补丁通过验证,它将被集成到主模型中,然后循环重复。

相关开源项目:
虽然 Recursive 是专有的,但有几个开源项目探索了相关理念。GitHub 上的 "Self-Improving AI" 仓库(目前约 8000 星)实现了一个简单循环,其中语言模型生成代码来改进自身的提示工程。另一个项目 "Neural Architecture Search with Reinforcement Learning"(NAS-RL,约 12000 星)开创了使用强化学习设计神经网络架构的先河,尽管它不允许模型重写自身代码。Recursive 的方法更接近于机器人领域使用的 "Code as Policy" 范式,即模型生成并执行代码来控制机器人。关键区别在于,Recursive 将此应用于模型本身。

基准测试数据:
| 基准测试 | 当前 SOTA (GPT-4o) | Recursive 内部数据 (泄露) | 提升幅度 |
|---|---|---|---|
| MMLU (5-shot) | 88.7 | 91.2 | +2.8% |
| HumanEval (Pass@1) | 90.2 | 94.5 | +4.8% |
| MATH (Level 5) | 76.3 | 82.1 | +7.6% |
| GSM8K | 96.4 | 98.1 | +1.8% |
| AgentBench (Code) | 68.5 | 79.3 | +15.8% |

数据解读: 泄露的内部基准测试表明,Recursive 的自我改进系统在复杂推理和编码任务上已经超越了 GPT-4o,其中在智能体代码生成方面提升最大。这种改进并非均匀分布——简单任务上的收益较小——但趋势是明确的:递归自我改进在解决最困难的问题上带来了最大的回报。

关键人物与案例研究

Peter Norvig 是最重要的招聘。作为使用最广泛的 AI 教材的合著者,他塑造了该领域的理论基础。他在谷歌从事大规模 NLP 和搜索算法的工作,使他对什么在规模化下有效有了实际洞察。Norvig 长期以来一直是数据驱动方法的倡导者,但他加入 Recursive 表明他相信下一个飞跃将来自元学习,而不仅仅是更多数据。

Recursive 创始团队: 该公司由一群前 DeepMind 和 OpenAI 的研究人员创立,他们倾向于保持匿名。然而,泄露的文件显示,其 CTO 是可微编程领域的顶尖专家,并曾发表过关于“自指神经网络”的论文。CEO 此前曾成功创立一家自动驾驶初创公司。

竞争方法对比:
| 公司/项目 | 方法 | 融资额 | 状态 |
|---|---|---|---|
| Recursive | 通过代码生成实现递归自我改进 | 40亿美元 | 隐秘模式 |
| OpenAI | Scaling 定律 + RLHF | 130亿+美元 | 公开 |
| Anthropic | 宪法 AI + 可解释性 | 76亿美元 | 公开 |
| DeepMind | AlphaFold/AlphaZero + RL | 不适用 (Alphabet) | 公开 |
| Sakana AI | 进化式自我优化 | 3000万美元 | 隐秘模式 |
| Adept AI | 基于智能体的系统 | 3.5亿美元 | 公开 |

数据解读: Recursive 的 40 亿美元融资对于一家隐秘阶段的初创公司来说是前所未有的,超过了众多上市 AI 公司的总融资额。这表明投资者对自我改进 AI 的潜力抱有极大信心。

更多来自 Hacker News

AI实验室吞下300亿美元:风险资本的垄断时刻已至Anthropic即将完成的300亿美元融资轮,标志着人工智能与风险资本行业的一个分水岭时刻。这笔融资的规模之大——超过了全球大多数行业风险投资的总和——揭示出AI开发已进入一个资本密集度堪比国家级基础设施项目的新时代。其根本驱动力是对规模PDF到AI的管道:重塑企业AI的隐藏数据基础设施革命AI行业对扩展定律和新模型架构的痴迷掩盖了一个关键真相:企业AI最有价值的数据仍被锁在PDF中。这些文档——包含财务报告、法律合同、科学论文和监管文件——并非纯文本。它们是复杂的布局,含有多列文本、嵌套表格、嵌入图像、脚注和页眉,传统提取工AI“红线”之困:大模型竞赛中,效率为何比规模更重要大语言模型行业正陷入一种危险的执念:为了在基准测试上获得微小的分数提升,将模型推向硬件的绝对极限。工程师们称之为“红线”操作(redlining),这种做法带来的收益正急剧递减,严重威胁着 AI 大规模部署的可行性。AINews 深入剖析了查看来源专题页Hacker News 已收录 3459 篇文章

相关专题

AI alignment43 篇相关文章

时间归档

May 20261684 篇已发布文章

延伸阅读

AI智能体学会自我复制:谁来设计人类交互界面?AI智能体已跨越关键门槛:它们能自我复制、生成子智能体并优化自身代码。然而,随着这些数字实体不断增殖,人类交互界面层却严重滞后。本文深度剖析技术突破、设计缺陷,以及构建可控容器的竞赛。Maggy AI跨会话记忆:自我进化的软件工程师时代来临一款名为Maggy的新型AI工程平台正打破无状态编程助手的固有模式。通过引入持久化、跨会话记忆,Maggy能记住过去的调试过程、架构决策和代码优化,从而在项目间实现自我改进。这一从无状态工具到自我进化数字工程师的飞跃,可能从根本上重塑软件的WUPHF:用AI“同侪压力”终结多智能体团队失控危机多智能体AI系统长期受困于一个致命缺陷:上下文漂移。新开源的WUPHF框架,通过为每个智能体锚定一个共享、版本控制的维基,构建起“集体记忆”,让智能体相互纠错,将混乱的专家团队转变为自律、自纠的研究小组。AI将在2029年实现自我发明:Anthropic联合创始人对自主研究的严厉警告Anthropic联合创始人Jack Clark给出了60%的概率,认为到2029年AI系统将能自主完成研发工作。这一预测标志着AI从工具向自主发明者的转变,将从根本上重塑模型开发、安全治理以及整个AI行业的商业模式。

常见问题

这次公司发布“Peter Norvig Joins Recursive: $4B Bet on Self-Improving AI Systems”主要讲了什么?

Peter Norvig, co-author of the seminal textbook *Artificial Intelligence: A Modern Approach* and former Director of Research at Google, has officially joined Recursive, a stealthy…

从“Peter Norvig Recursive salary”看,这家公司的这次发布为什么值得关注?

Recursive's core thesis is that the current paradigm of scaling parameters, data, and compute is hitting diminishing returns. The company is building what it calls a "self-modifying cognitive architecture" — a system whe…

围绕“Recursive AI self-improving architecture explained”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。