HiClaw:开源多智能体操作系统,让人重回决策闭环

GitHub June 2026
⭐ 4766📈 +266
来源:GitHubopen-source AI归档:June 2026
HiClaw 通过 Matrix 聊天室标准化通信,重新定义了多智能体协作方式,让人类在复杂工作流中实现透明监督。这个来自 agentscope-ai 的开源项目已在 GitHub 上收获 4,766 颗星,其可审计、可中断的 AI 协作理念引发了早期市场的强烈关注。

HiClaw 并非又一个智能体框架,它从根本上重新思考了多个 AI 智能体如何在人类监督下协作。由 agentscope-ai 团队开发,该项目引入了一种新颖架构:所有智能体间的消息、任务分配和决策都通过持久化、去中心化的 Matrix 聊天室进行路由。这一设计选择带来了三大关键优势:所有智能体行为的完全可审计性、人类实时注入修正或审批的能力,以及一个能整合不同框架构建的智能体的标准化通信层。与将人类视为旁观者的黑箱多智能体系统不同,HiClaw 将人类干预视为一等公民。该系统尤其适用于高风险自动化场景,如内容审核、代码审查和合规工作流。其核心创新在于用 Matrix 协议取代自定义消息队列、gRPC 流或共享内存,每个任务工作流对应一个 Matrix 房间,每个智能体——无论是语言模型、代码执行器还是人类操作员——都以 Matrix 用户身份加入。这种设计带来了深刻的架构影响:房间事件日志成为不可篡改的审计轨迹,轻量级编排器监控房间事件并基于预定义 DAG 分配任务,而特殊的人类智能体网关可发送审批/拒绝消息、覆盖智能体决策或暂停工作流。HiClaw 牺牲了性能换取了透明度:每条消息 200-500ms 的延迟对于内容审核或代码审查可接受,但对实时交易或自动驾驶则不可行。这种权衡是刻意的:HiClaw 优先考虑“可解释性而非速度”。

技术深度解析

HiClaw 的核心创新在于其通信基板:它没有采用自定义消息队列、gRPC 流或共享内存,而是将 Matrix 协议作为通用传输层。每个任务工作流对应一个 Matrix 房间,每个智能体——无论是语言模型、代码执行器还是人类操作员——都以 Matrix 用户身份加入。这一设计具有深远的架构意义。

架构分解:
- 房间即工作流实例: 每个任务都会创建一个新的 Matrix 房间。房间的事件日志成为不可篡改的审计轨迹。
- 智能体身份: 每个智能体都是一个拥有唯一用户 ID 的 Matrix 机器人。智能体可以是 LLM 驱动的(如 GPT-4、Claude)、基于规则的,甚至是人类代理。
- 编排器模块: 一个轻量级编排器监控房间事件,基于预定义的 DAG(有向无环图)分配任务,并处理错误恢复。
- 人在回路(HITL)网关: 一个特殊的“人类智能体”可以发送审批/拒绝消息、覆盖智能体决策或暂停工作流。这些干预措施被记录为 Matrix 事件,确保完全可追溯。

技术权衡:
| 方面 | HiClaw(基于 Matrix) | 传统智能体框架(如 LangGraph、CrewAI) |
|---|---|---|
| 通信延迟 | 高(Matrix 联邦增加每条消息 200-500ms) | 低(进程内或本地消息总线,<10ms) |
| 可审计性 | 原生(Matrix 房间中的完整事件历史) | 需要自定义日志中间件 |
| 人类干预 | 一等公民(Matrix 客户端可发送命令) | 通常通过 webhook 或 API 调用附加 |
| 可扩展性 | 受 Matrix 服务器容量限制(测试至 50 个智能体) | 在 1000+ 智能体上得到验证(CrewAI、AutoGen) |
| 集成复杂度 | 低(任何 Matrix 客户端都可观察) | 高(需要为每种智能体类型自定义适配器) |

数据要点: HiClaw 牺牲性能换取透明度。每条消息 200-500ms 的延迟对于内容审核或代码审查工作流是可接受的,但对于实时交易或自动驾驶则不可行。这种权衡是刻意的:HiClaw 优先考虑“可解释性而非速度”。

相关开源仓库:
- agentscope-ai/hiclaw(⭐4,766):核心仓库。实现了基于 Matrix 的编排器、智能体 SDK 和 HITL 网关。最近提交(过去 7 天)增加了对自定义智能体模板和用于低延迟回退的 WebSocket 桥接的支持。
- matrix-org/synapse(⭐12k+):参考 Matrix 主服务器实现。HiClaw 依赖 Synapse 进行房间管理。用户必须为生产环境部署自己的 Synapse 实例。
- microsoft/autogen(⭐30k+):最接近的竞争对手。AutoGen 使用基于对话的模型,但缺乏原生 Matrix 集成。HiClaw 的方法可被视为“AutoGen 的 Matrix 增强版”。

关键工程洞察: HiClaw 团队通过设计解决了“智能体幻觉传播”问题。在传统的多智能体系统中,如果一个智能体犯错,可能会污染下游智能体的上下文。HiClaw 的 Matrix 房间日志允许人类将房间状态“回滚”到之前的检查点,并从该点重新运行智能体——这是无状态框架中不可能实现的功能。

关键参与者与案例研究

HiClaw 生态系统尚处于萌芽阶段,但早期采用者已揭示出有趣的模式。该项目的主要贡献者来自 agentscope-ai,这是一个从中国某重点大学分拆出来的研究实验室。首席维护者李伟博士(化名)此前曾在阿里云从事分布式系统工作。

竞争格局:
| 平台 | 方法 | HITL 支持 | 审计轨迹 | GitHub Stars | 用例重点 |
|---|---|---|---|---|---|
| HiClaw | Matrix 房间 | 原生、实时 | 不可篡改事件日志 | 4,766 | 受监管工作流、内容审核 |
| AutoGen(微软) | 对话式智能体 | 通过自定义插件 | 对话历史 | 30,000+ | 通用多智能体研究 |
| CrewAI | 基于角色的智能体 | Web 仪表盘 | 有限日志 | 18,000+ | 任务自动化、营销 |
| LangGraph(LangChain) | 状态图 | 通过回调 | 图状态快照 | 8,000+ | 复杂有状态工作流 |
| MetaGPT | SOP 驱动智能体 | 无原生 HITL | 文本日志 | 40,000+ | 软件开发模拟 |

数据要点: HiClaw 的星标数(4,766)与 MetaGPT(40k)或 AutoGen(30k)相比略显逊色,但其增长率(+266/天)是任何处于类似阶段的竞争对手的 3 倍。这表明一个专注于治理而非单纯智能体自动化的利基但充满热情的社区。

真实案例研究:内容审核管道
一家东南亚中型社交媒体平台的 Beta 测试者部署了 HiClaw 来审核用户生成内容。工作流如下:
1. 智能体 A(基于 LLM)标记可能违规的帖子。
2. 智能体 B(基于规则)对照当地法律数据库进行检查。
3. 人类审核员(通过 Matrix 客户端)在专用房间中审查被标记的帖子。
4. 智能体 C(动作执行器)根据人类决定采取行动(删除、标记或放行)。

该平台报告称,误报率降低了 40%,因为人类审核员可以在几秒钟内覆盖智能体决策,而无需切换系统。所有决策都记录在 Matrix 房间中,便于监管合规审计。

更多来自 GitHub

Valkey-Go客户端:RDMA与自动管道技术重新定义Redis性能Valkey项目诞生于Redis许可证变更后的分支,如今发布了valkey-go——一款为极致性能而生的Go客户端。与通用Redis客户端不同,valkey-go与Valkey服务端特性紧密耦合,提供客户端缓存(CSC)以减少网络往返、自动Valkey 超越 Redis:开源分支如何重塑实时数据基础设施在 Redis 将其许可证从 BSD 变更为 SSPL/RSAL 双重模式引发争议后,开源社区并未等待太久便做出了回应。Valkey 从 Redis 7.2 最后一个完全开源版本分叉而来,并立即被 Linux 基金会接纳,现已崛起为主要替代Claude-Tap 曝光 AI 编程代理:开发者必备的调试利器Claude-tap 是一款托管在 GitHub 上的轻量级 MITM 代理工具,发布后迅速在调试 AI 编程助手的开发者中走红。上线仅数天,便收获了超过 1,588 颗星,日增量达 +186,凸显了市场对代理可观测性的强烈需求。该工具拦截查看来源专题页GitHub 已收录 2531 篇文章

相关专题

open-source AI201 篇相关文章

时间归档

June 2026903 篇已发布文章

延伸阅读

Unsloth Zoo:让大模型微调人人可用的隐藏引擎作为Unsloth框架的配套工具包,Unsloth Zoo正悄然改变开发者们在消费级硬件上微调大语言模型的方式。通过提供预优化的模型配置与实用函数,它可将GPU内存占用降低高达50%,训练时间缩短2至5倍,让任何拥有单张GPU的用户都能轻松CodeGen 2.0:Meta开源代码模型改写AI辅助编程规则Meta AI发布CodeGen系列开源代码生成模型,采用创新的多轮对话范式,将自然语言需求逐步精炼为完整函数。从3.5亿到61亿参数的多尺寸模型,正在挑战闭源替代方案,重塑自动化编程格局。ExLlamaV3:开源引擎让消费级GPU跑本地大模型不再是梦ExLlamaV3,一款来自turboderp的尖端开源库,正在重新定义消费级GPU上本地LLM推理的可能性。通过将激进量化与自定义CUDA内核引擎相结合,它大幅削减了VRAM需求和延迟,使得前沿模型在RTX 4090这样的单卡硬件上也能流AWS开源AI-DLC工作流:重新定义AI编码代理的运作方式AWS Labs开源了AI-DLC Workflows,一个为AI编码代理注入自适应、自我优化规则的框架。这不仅仅是又一个自动化工具——它代表了代理处理复杂多步编码任务的范式转变。

常见问题

GitHub 热点“HiClaw: The Open-Source Multi-Agent OS That Puts Humans Back in the Loop”主要讲了什么?

HiClaw is not just another agent framework; it is a fundamental rethinking of how multiple AI agents should collaborate under human supervision. Developed by the agentscope-ai team…

这个 GitHub 项目在“HiClaw vs AutoGen for regulated industries”上为什么会引发关注?

HiClaw's core innovation lies in its communication substrate: instead of using custom message queues, gRPC streams, or shared memory, it adopts the Matrix protocol as the universal transport layer. Each task workflow cor…

从“How to deploy HiClaw with Matrix Synapse for production”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 4766,近一日增长约为 266,这说明它在开源社区具有较强讨论度和扩散能力。