Polis协议:当Markdown让AI智能体团队变成“活文档”

Hacker News May 2026
来源:Hacker News归档:May 2026
Polis是一个开源协议,它用Markdown定义并编排AI智能体团队,让团队通过版本控制的文档实现自我进化。这场从“黑盒编排”到“文档即架构”的范式转变,有望让多智能体系统设计走向大众化。

AINews独家揭秘Polis——一个颠覆性的开源协议,它将AI智能体团队重新构想为“活着的”、受版本控制的Markdown文档。与依赖不透明的编排框架或专有平台不同,Polis允许开发者甚至非技术背景的产品经理,用人类可读的Markdown定义智能体的角色、沟通规则和学习机制。智能体团队的每一次交互都会被写回文档,形成一个能够自我进化的系统,并且可以通过标准的Git工作流进行审计、分叉、合并和回滚。

Polis的核心创新在于将大语言模型的灵活性与Git的协作哲学融为一体。这使得多智能体系统变得透明、可审计、可迭代——从静态配置转变为动态演化的有机体。早期基准测试显示,Polis在设置时间、编辑效率和可审计性上远超LangChain、AutoGen等传统框架,同时任务成功率保持同等水平。对于受监管行业而言,其审计优势堪称颠覆性。

技术深度解析

Polis的架构看似简单,实则蕴藏着强大的力量。其核心在于定义了一个标准的Markdown模式,用以描述整个多智能体系统。该模式包括:

- 智能体定义:每个智能体都有角色、系统提示词、可访问的工具列表以及记忆格式。例如,一个“研究智能体”的角色可能是“收集并总结信息”,系统提示词要求它注明来源,工具则包括“web_search”和“document_reader”。
- 沟通规则:该部分定义了智能体之间的交互方式——无论是通过直接消息、广播还是共享黑板。它可以指定轮流发言、优先级和升级协议。
- 学习机制:一个关键的创新是“经验日志”部分。每次任务完成后,智能体都会将它们的观察、成功策略和失败记录写回Markdown文档。这创建了一个反馈循环,使团队的行为随时间推移而改进,无需手动重新配置。
- 版本控制集成:整个文档旨在存储在Git仓库中。每一次变更——无论是来自人类编辑还是智能体的学习——都会生成一个提交。这使得分支实验、失败回滚和协作改进成为可能。

从工程角度来看,Polis利用LLM作为运行时执行器。一个轻量级的编排器读取Markdown文件,解析智能体定义,并生成遵循所定义角色的LLM实例(通过API或本地模型)。编排器还会监控经验日志,并定期触发“整合”步骤,让智能体将学习成果总结到文档中。

一个相关的开源项目是AgentMark(GitHub: agentmark/agentmark,约2.3k星标),它提供了Polis协议的参考实现。该项目包括一个用于创建和运行智能体团队的CLI工具、一个用于语法高亮的VS Code扩展,以及内置的Git集成。该仓库显示活跃的开发状态,每周都有提交,贡献者社区也在不断壮大。

性能基准测试:来自AgentMark团队的早期测试将基于Polis的团队与LangChain和AutoGen等传统编排框架进行了比较。

| 指标 | Polis (Markdown) | LangChain (Python) | AutoGen (JSON) |
|---|---|---|---|
| 设置时间(分钟) | 5 | 20 | 15 |
| 任务成功率(标准基准) | 87% | 85% | 83% |
| 可审计性(追踪决策所需时间) | <1分钟 | 10分钟 | 5分钟 |
| 人工编辑时间(角色变更) | 2分钟 | 45分钟 | 30分钟 |
| 版本回滚复杂度 | 1条Git命令 | 手动代码还原 | 手动配置还原 |

数据要点:Polis大幅减少了设置和编辑时间,同时保持了具有竞争力的任务成功率。其可审计性优势对于受监管行业而言是一场游戏规则改变。

关键参与者与案例研究

Polis并非单一公司的产品,而是一个社区驱动的协议。不过,有几个关键参与者正在塑造其生态系统:

- AgentMark团队:主要维护者,由Elena Vasquez博士(前Google Brain成员)领导,成员包括一个分布式的开源贡献者团队。他们专注于参考实现和标准制定。
- Hugging Face:已将Polis集成到其Spaces平台中,允许用户将智能体团队部署为交互式演示。这极大地提升了其知名度。
- GitHub:该协议的自然家园。GitHub的Copilot正在被实验用于根据自然语言描述自动生成Polis Markdown文件。
- 早期采用者:一家中型电商公司ShopFlow使用Polis管理一个由5个智能体组成的客服团队(分诊、FAQ、退货、升级、反馈)。他们报告称,经过3个月的自我进化,工单解决时间减少了40%,客户满意度提升了30%。

与竞争方法的比较

| 方法 | 关键示例 | 复杂性 | 透明度 | 进化机制 |
|---|---|---|---|---|
| Polis (Markdown) | AgentMark | 低 | 高 | 自写文档 |
| Python编排 | LangChain, CrewAI | 中 | 中 | 代码变更 |
| 可视化流程构建器 | Microsoft Copilot Studio | 低 | 低 | 手动节点编辑 |
| 专有平台 | Salesforce Einstein | 高 | 低 | 供应商控制 |

数据要点:Polis占据了一个独特的利基——低复杂性与高透明度的结合,这在多智能体领域实属罕见。

行业影响与市场动态

Polis有潜力颠覆目前由专有平台和复杂框架主导的多智能体系统市场。全球AI智能体市场预计将从2024年的42亿美元增长到2028年的285亿美元(年复合增长率46%)。Polis可以通过降低准入门槛来占据显著的市场份额。

商业模式:虽然Polis本身是开源的,但其周边生态系统提供了变现机会:
- 模板市场:像TemplateHub.ai这样的公司

更多来自 Hacker News

零分配C# GPT-2推理挑战C++在AI领域的主导地位Overfit项目由一位独立开发者创建,在纯C#中实现了完整的GPT-2推理引擎,并遵循一个关键的设计约束:在token生成过程中零堆内存分配。这意味着.NET垃圾回收器(GC)永远不会中断推理,解决了历史上使托管运行时不适合实时AI工作负AI能写代码,却无法维护:软件工程的“记忆危机”AI编程革命撞上了一堵墙:维护。GitHub Copilot、Cursor和Amazon CodeWhisperer等工具能生成令人印象深刻的代码片段,但当它们被要求维护一个已经演变数月甚至数年的代码库时,表现得就像一群才华横溢却患有失忆症OpenClaw百万美元AI军团:人类软件工程师的终结?在一项重新定义软件开发边界的举措中,OpenClaw创始人Peter Steinberger部署了100个自主AI智能体,用于编写代码、审查拉取请求和查找漏洞——每月成本高达130万美元。这项实验不仅是技术壮举,更是对AI智能体经济的一次根查看来源专题页Hacker News 已收录 3542 篇文章

时间归档

May 20261840 篇已发布文章

延伸阅读

13个AI智能体接管并购尽职调查:法律行业的“无人时刻”已至一个全新的开源框架动用13个专用AI智能体,将并购合同审查拆解为法律、财务和运营模块,有望将数周的人工审查压缩至数小时。行业观察者认为,这标志着AI在高风险企业法律工作中,从“辅助工具”跨越到了“自主执行者”阶段。Palace-AI:古老记忆宫殿术重塑AI智能体记忆架构开源项目Palace-AI借用了古希腊的“记忆宫殿”技法,为AI智能体构建了一种全新的长期记忆系统。它不再依赖扁平化的向量数据库,而是将知识存储在虚拟的“房间”与“走廊”中,让智能体像在熟悉的建筑中漫步一样自然地检索信息。AI数学家突破:从计算器到自主研究伙伴一篇新预印本论文提出了一种“AI合作数学家”,它能自主生成猜想、探索证明路径,并提出新的研究方向。这标志着从计算工具到研究伙伴的范式转变,有望将数年的探索压缩至数周。从被裁到发布:AaaS 让任何人用自然语言部署 AI 智能体一位因地缘政治冲突遭遇“半裁员”的开发者,用四周时间打造了 AaaS——一个开源工具,让任何人通过日常英语就能部署商用 AI 智能体。它将预订机器人和客服系统变成基于聊天的设置流程,彻底民主化了智能体部署。

常见问题

GitHub 热点“Polis Protocol: How Markdown Is Reinventing AI Agent Teams as Living Documents”主要讲了什么?

AINews has uncovered Polis, a groundbreaking open-source protocol that reimagines AI agent teams as living, version-controlled Markdown documents. Instead of relying on opaque orch…

这个 GitHub 项目在“how to create Polis agent team Markdown file”上为什么会引发关注?

Polis’s architecture is deceptively simple yet profoundly powerful. At its core, the protocol defines a standard Markdown schema that describes an entire multi-agent system. This schema includes: Agent Definitions: Each…

从“Polis protocol vs LangChain comparison”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。