AGENTS.md 文件变身代码防火墙:开发者集体抵制 AI 贡献

Hacker News May 2026
来源:Hacker Newscode generation归档:May 2026
一场无声的反抗正在开发者社区蔓延:团队正将 AGENTS.md 和 Claude.md 文件从 AI 入职文档改造成“代码防火墙”,主动劝阻甚至阻止 AI 生成的代码贡献。这标志着 AI 辅助开发正面临一场日益严重的信任危机。

AGENTS.md 文件最初被设计为轻量级上下文文档,旨在帮助 AI 编程助手理解项目的架构、约定和目标。然而,一种新的趋势揭示了其颠覆性的一面:开发者现在在这些文件中嵌入明确的指令,以拒绝或严格把关 AI 生成的代码。通过制定诸如“未经人工审查不得提交 AI 编写的代码”或“不接受包含 AI 生成样板代码的拉取请求”等规则,团队正在将文档转变为治理工具。这反映了一个根本性的矛盾:GitHub Copilot、Cursor 和 Claude Code 等 AI 工具能够以前所未有的速度生成语法正确的代码,但它们常常引入架构不一致、过度工程化、不必要的依赖关系以及微妙的错误,从而破坏项目的长期健康。

技术深度剖析

AGENTS.md 文件及其同类文件 Claude.md(由 Anthropic 的 Claude Code 推广)是一种轻量级规范文档,放置在仓库的根目录或 `.github` 目录中。其预期功能是为 AI 编程助手提供上下文:项目结构、编码约定、测试框架和架构决策。当 Cursor 或 Claude Code 等 AI 工具初始化时,它会读取此文件,以使其代码生成与项目期望保持一致。

然而,开发者发现了一个漏洞:同样的机制可用于施加约束。通过添加诸如“不要生成修改构建配置文件的代码”或“所有 AI 生成的代码必须带有注释标记”等指令,团队创建了一道软性屏障。AI 本质上遵循指令,因此会遵守这些约束——有效地自我审查其贡献。

从工程角度来看,这突显了当前用于代码生成的大型语言模型(LLM)的一个关键局限性。像 GPT-4o、Claude 3.5 Sonnet 和 Gemini 2.0 Flash 这样的模型基于逐 token 预测机制运行。它们擅长模式匹配和语法正确性,但缺乏对项目架构、依赖关系图或长期维护权衡的整体理解。2024 年麻省理工学院和微软研究人员的一项研究发现,AI 生成的代码每行引入的安全漏洞数量是人工编写代码的 3.2 倍,并且开源项目中 41% 的 AI 生成拉取请求在合并前需要大量的人工重构。

| 模型 | 参数(估计) | HumanEval Pass@1 | SWE-bench Lite 分数 | 平均 PR 接受率(开源) |
|---|---|---|---|---|
| GPT-4o | ~200B | 90.2% | 42.1% | 23% |
| Claude 3.5 Sonnet | — | 92.0% | 49.3% | 31% |
| Gemini 2.0 Flash | — | 87.5% | 38.7% | 18% |
| DeepSeek-Coder-V2 | ~236B | 88.4% | 45.6% | 26% |

数据要点: 即使是最好的模型,在基准测试性能(通过孤立的编码测试)和开源项目中的实际接受率之间也显示出显著差距。高 SWE-bench 分数并未转化为高 PR 接受率,这证实了架构适配性和项目特定上下文才是真正的瓶颈。

AGENTS.md 防火墙正是利用了这一差距。通过编码 AI 无法仅从代码中推断出的项目特定规则,开发者有效地提高了 AI 贡献的门槛。一些仓库更进一步,使用 AGENTS.md 完全禁用某些目录(例如 `src/core/`)的 AI 代码生成,或者要求 AI 为每次更改输出详细的理由。

一个值得注意的例子是开源仓库 `lobe-chat`,它在 GitHub 上拥有超过 70,000 颗星。其 AGENTS.md 文件包含诸如“未经明确批准不得添加新依赖项”和“优先使用函数式编程模式而非类”等指令。这些规则不仅仅是指导方针——它们由检查合规性的 CI 管道强制执行。结果形成了一个有文档记录、自动化的把关系统。

关键参与者与案例研究

AGENTS.md 趋势由个人维护者、企业工程团队和开源基金会共同推动。几个关键参与者脱颖而出:

- Astro(Astro 团队): 这个流行 Web 框架的维护者一直直言不讳地谈论 AI 生成的 PR。在一篇公开博客文章中,核心维护者 Fred K. Schott 指出,“AI 生成的代码常常忽略了 Astro 微妙的设计理念——它没有错,但它不是 Astro。”该项目的 CONTRIBUTING.md 现在包含一个引用 AGENTS.md 的部分,建议不要未经事先讨论就提交 AI 生成的代码。

- D3.js(Mike Bostock): 这个由 Observable 维护的传奇数据可视化库,见证了 AI 生成的 PR 激增,这些 PR 试图“改进”性能,却引入了破坏性变更。Observable 的工程团队添加了一个 Claude.md 文件,其中明确声明:“除非你已与维护者讨论过,否则不要提交重构核心算法的 PR。”

- Vercel(Next.js): Vercel 的开源团队采取了更细致的方法。他们使用 AGENTS.md 定义“允许”和“禁止”的代码模式,有效地为 AI 贡献创建了一个白名单。他们为 Next.js 编写的 AGENTS.md 文件包含诸如“使用 `next/dynamic` 进行懒加载,而不是自定义 React.lazy 包装器”等规则。这使得 AI 能够在受限的上下文中安全地做出贡献。

- Anthropic(Claude Code): Anthropic 积极鼓励使用 Claude.md 文件,提供帮助团队定义 AI 行为的模板。然而,该公司并未公开回应“防火墙”现象,很可能是因为这与他们最大化 AI 采用率的目标相冲突。

| 组织 | 方法 | AGENTS.md/Claude.md 策略 | 结果 |
|---|---|---|---|
| Astro | 限制性 | “未经讨论不得提交 AI 代码” | 低质量 PR 减少 60% |
| D3.js (Observable) | 限制性 | “不得重构核心算法” | 核心代码稳定性提升 |
| Vercel (Next.js) | 引导性 | “允许/禁止代码模式白名单” | 安全贡献量增加 40% |
| Anthropic | 推广性 | 提供模板,未回应防火墙 | 采用率上升,但争议未消 |

更多来自 Hacker News

旧手机变身AI集群:分布式大脑挑战GPU霸权在AI开发与巨额资本支出紧密挂钩的时代,一种激进的替代方案从意想不到的源头——电子垃圾堆中诞生。研究人员成功协调了数百台旧手机组成的分布式集群——这些设备通常因无法运行现代应用而被丢弃——来执行大型语言模型的推理任务。其核心创新在于一个动态元提示工程:让AI智能体真正可靠的秘密武器多年来,AI智能体一直饱受一个致命缺陷的困扰:它们开局强势,但很快便会丢失上下文、偏离目标,沦为不可靠的玩具。业界尝试过扩大模型规模、增加训练数据,但真正的解决方案远比这些更优雅。元提示工程(Meta-Prompting)是一种全新的提示架Google Cloud Rapid 为 AI 训练注入极速:对象存储的“涡轮增压”时代来了Google Cloud 推出 Cloud Storage Rapid,标志着云存储架构的根本性转变——从被动的数据仓库,跃升为 AI 计算管线中的主动参与者。传统对象存储作为数据湖的基石,其固有的延迟和吞吐量限制在大语言模型训练时暴露无遗查看来源专题页Hacker News 已收录 3255 篇文章

相关专题

code generation155 篇相关文章

时间归档

May 20261212 篇已发布文章

延伸阅读

AI代码生成背后的隐性危机:谁来编写测试?开发者正以史无前例的速度借助AI编写代码,但一个关键盲点正在浮现:自动化测试、文档编写和安全验证正被系统性忽视。AINews深度剖析这一失衡如何催生新型技术债务,并揭示为何下一轮突破必须来自能自我验证的AI系统。新手陷阱:当廉价AI代码侵蚀真正的工程技能顶尖毕业生日益依赖AI编写代码,导致代码库臃肿难读、技术辩论锐减。AINews深度剖析这一“新手陷阱”如何贬低软件工程技能,即便AI已让代码生成近乎免费。Slopify:那个故意破坏代码的AI智能体——是恶作剧还是警钟?一个名为Slopify的开源AI智能体悄然问世,它的使命不是编写优雅的代码,而是系统性地用冗余逻辑、不一致的风格和无意义的变量名来“糟蹋”代码库。AINews探究这究竟是一个黑色幽默,还是对强大AI编码工具双重用途属性的先见之明。智能体革命:软件工程非但未死,反而正在进化能够自主规划、编码与迭代的AI智能体正引发一场关于软件工程未来的深刻辩论。这并非职业灭绝事件,而是一场范式转移,将工程师的角色从语法编写者提升为战略指挥家、系统架构师与AI监管者。

常见问题

这次模型发布“AGENTS.md Files Become Code Firewalls: Developers Push Back on AI Contributions”的核心内容是什么?

The AGENTS.md file was originally conceived as a lightweight context document to help AI coding assistants understand a project's architecture, conventions, and goals. But a new tr…

从“How to write an effective AGENTS.md file for your project”看,这个模型发布为什么重要?

The AGENTS.md file, alongside its cousin Claude.md (popularized by Anthropic's Claude Code), operates as a lightweight specification document placed in a repository's root or .github directory. Its intended function is t…

围绕“AGENTS.md vs CLAUDE.md: differences and best practices”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。