HiClaw：开源多智能体操作系统，让人重回决策闭环

Q: 从“How to deploy HiClaw with Matrix Synapse for production”看，这个 GitHub 项目的热度表现如何？

当前相关 GitHub 项目总星标约为 4766，近一日增长约为 266，这说明它在开源社区具有较强讨论度和扩散能力。

HiClaw 并非又一个智能体框架，它从根本上重新思考了多个 AI 智能体如何在人类监督下协作。由 agentscope-ai 团队开发，该项目引入了一种新颖架构：所有智能体间的消息、任务分配和决策都通过持久化、去中心化的 Matrix 聊天室进行路由。这一设计选择带来了三大关键优势：所有智能体行为的完全可审计性、人类实时注入修正或审批的能力，以及一个能整合不同框架构建的智能体的标准化通信层。与将人类视为旁观者的黑箱多智能体系统不同，HiClaw 将人类干预视为一等公民。该系统尤其适用于高风险自动化场景，如内容审核、代码审查和合规工作流。其核心创新在于用 Matrix 协议取代自定义消息队列、gRPC 流或共享内存，每个任务工作流对应一个 Matrix 房间，每个智能体——无论是语言模型、代码执行器还是人类操作员——都以 Matrix 用户身份加入。这种设计带来了深刻的架构影响：房间事件日志成为不可篡改的审计轨迹，轻量级编排器监控房间事件并基于预定义 DAG 分配任务，而特殊的人类智能体网关可发送审批/拒绝消息、覆盖智能体决策或暂停工作流。HiClaw 牺牲了性能换取了透明度：每条消息 200-500ms 的延迟对于内容审核或代码审查可接受，但对实时交易或自动驾驶则不可行。这种权衡是刻意的：HiClaw 优先考虑“可解释性而非速度”。

技术深度解析

HiClaw 的核心创新在于其通信基板：它没有采用自定义消息队列、gRPC 流或共享内存，而是将 Matrix 协议作为通用传输层。每个任务工作流对应一个 Matrix 房间，每个智能体——无论是语言模型、代码执行器还是人类操作员——都以 Matrix 用户身份加入。这一设计具有深远的架构意义。

架构分解：
- 房间即工作流实例： 每个任务都会创建一个新的 Matrix 房间。房间的事件日志成为不可篡改的审计轨迹。
- 智能体身份： 每个智能体都是一个拥有唯一用户 ID 的 Matrix 机器人。智能体可以是 LLM 驱动的（如 GPT-4、Claude）、基于规则的，甚至是人类代理。
- 编排器模块： 一个轻量级编排器监控房间事件，基于预定义的 DAG（有向无环图）分配任务，并处理错误恢复。
- 人在回路（HITL）网关： 一个特殊的“人类智能体”可以发送审批/拒绝消息、覆盖智能体决策或暂停工作流。这些干预措施被记录为 Matrix 事件，确保完全可追溯。

技术权衡：
| 方面 | HiClaw（基于 Matrix） | 传统智能体框架（如 LangGraph、CrewAI） |
|---|---|---|
| 通信延迟 | 高（Matrix 联邦增加每条消息 200-500ms） | 低（进程内或本地消息总线，<10ms） |
| 可审计性 | 原生（Matrix 房间中的完整事件历史） | 需要自定义日志中间件 |
| 人类干预 | 一等公民（Matrix 客户端可发送命令） | 通常通过 webhook 或 API 调用附加 |
| 可扩展性 | 受 Matrix 服务器容量限制（测试至 50 个智能体） | 在 1000+ 智能体上得到验证（CrewAI、AutoGen） |
| 集成复杂度 | 低（任何 Matrix 客户端都可观察） | 高（需要为每种智能体类型自定义适配器） |

数据要点： HiClaw 牺牲性能换取透明度。每条消息 200-500ms 的延迟对于内容审核或代码审查工作流是可接受的，但对于实时交易或自动驾驶则不可行。这种权衡是刻意的：HiClaw 优先考虑“可解释性而非速度”。

相关开源仓库：
- agentscope-ai/hiclaw（⭐4,766）：核心仓库。实现了基于 Matrix 的编排器、智能体 SDK 和 HITL 网关。最近提交（过去 7 天）增加了对自定义智能体模板和用于低延迟回退的 WebSocket 桥接的支持。
- matrix-org/synapse（⭐12k+）：参考 Matrix 主服务器实现。HiClaw 依赖 Synapse 进行房间管理。用户必须为生产环境部署自己的 Synapse 实例。
- microsoft/autogen（⭐30k+）：最接近的竞争对手。AutoGen 使用基于对话的模型，但缺乏原生 Matrix 集成。HiClaw 的方法可被视为“AutoGen 的 Matrix 增强版”。

关键工程洞察： HiClaw 团队通过设计解决了“智能体幻觉传播”问题。在传统的多智能体系统中，如果一个智能体犯错，可能会污染下游智能体的上下文。HiClaw 的 Matrix 房间日志允许人类将房间状态“回滚”到之前的检查点，并从该点重新运行智能体——这是无状态框架中不可能实现的功能。

关键参与者与案例研究

HiClaw 生态系统尚处于萌芽阶段，但早期采用者已揭示出有趣的模式。该项目的主要贡献者来自 agentscope-ai，这是一个从中国某重点大学分拆出来的研究实验室。首席维护者李伟博士（化名）此前曾在阿里云从事分布式系统工作。

竞争格局：
| 平台 | 方法 | HITL 支持 | 审计轨迹 | GitHub Stars | 用例重点 |
|---|---|---|---|---|---|
| HiClaw | Matrix 房间 | 原生、实时 | 不可篡改事件日志 | 4,766 | 受监管工作流、内容审核 |
| AutoGen（微软） | 对话式智能体 | 通过自定义插件 | 对话历史 | 30,000+ | 通用多智能体研究 |
| CrewAI | 基于角色的智能体 | Web 仪表盘 | 有限日志 | 18,000+ | 任务自动化、营销 |
| LangGraph（LangChain） | 状态图 | 通过回调 | 图状态快照 | 8,000+ | 复杂有状态工作流 |
| MetaGPT | SOP 驱动智能体 | 无原生 HITL | 文本日志 | 40,000+ | 软件开发模拟 |

数据要点： HiClaw 的星标数（4,766）与 MetaGPT（40k）或 AutoGen（30k）相比略显逊色，但其增长率（+266/天）是任何处于类似阶段的竞争对手的 3 倍。这表明一个专注于治理而非单纯智能体自动化的利基但充满热情的社区。

真实案例研究：内容审核管道
一家东南亚中型社交媒体平台的 Beta 测试者部署了 HiClaw 来审核用户生成内容。工作流如下：
1. 智能体 A（基于 LLM）标记可能违规的帖子。
2. 智能体 B（基于规则）对照当地法律数据库进行检查。
3. 人类审核员（通过 Matrix 客户端）在专用房间中审查被标记的帖子。
4. 智能体 C（动作执行器）根据人类决定采取行动（删除、标记或放行）。

该平台报告称，误报率降低了 40%，因为人类审核员可以在几秒钟内覆盖智能体决策，而无需切换系统。所有决策都记录在 Matrix 房间中，便于监管合规审计。

时间归档

延伸阅读

常见问题

GitHub 热点“HiClaw: The Open-Source Multi-Agent OS That Puts Humans Back in the Loop”主要讲了什么？

HiClaw is not just another agent framework; it is a fundamental rethinking of how multiple AI agents should collaborate under human supervision. Developed by the agentscope-ai team…

这个 GitHub 项目在“HiClaw vs AutoGen for regulated industries”上为什么会引发关注？

HiClaw's core innovation lies in its communication substrate: instead of using custom message queues, gRPC streams, or shared memory, it adopts the Matrix protocol as the universal transport layer. Each task workflow cor…

从“How to deploy HiClaw with Matrix Synapse for production”看，这个 GitHub 项目的热度表现如何？