Rivet Agent OS:基于WebAssembly的AI智能体基础设施革命

GitHub April 2026
⭐ 2662📈 +934
来源:GitHub归档:April 2026
开源项目Rivet Agent OS正瞄准AI智能体发展的核心瓶颈——执行环境开销,发起一场根本性变革。通过融合WebAssembly与V8隔离实例技术,它承诺实现近瞬时冷启动与成本的大幅降低,直接挑战传统容器与虚拟机沙箱的主导地位。

托管于GitHub仓库`rivet-dev/agent-os`下的Rivet Agent OS项目,为AI智能体的部署与执行方式带来了范式转移。该项目定位为专为智能体设计的便携式开源操作系统,其核心创新在于摒弃了重量级虚拟化方案,转而采用在V8 JavaScript引擎隔离实例中运行WebAssembly模块的架构。正是这一架构选择,支撑了其引人瞩目的性能宣称:约6毫秒的冷启动时间,以及据称比传统沙箱环境低32倍的运营成本。

这一进展意义重大。随着AI智能体从原型走向生产级系统,它们正面临类似早期云计算时代的可扩展性挑战。传统基于Docker容器或虚拟机的部署模型,因其固有的启动延迟和资源开销,难以支撑需要瞬时扩展、高并发或毫秒级响应的智能体应用场景。Rivet Agent OS的出现,为构建能够承载数千个瞬时并发智能体的基础设施提供了可能,尤其适用于需要大量分支操作、快速序列化工具调用或亚秒级交互响应的智能体模式。

该项目不仅是一个技术实现,更代表了基础设施层面向AI原生设计演进的重要趋势。它将智能体视为一等公民,通过极致的轻量化与隔离技术,为AI应用的规模化落地扫除了一道关键障碍。

技术深度解析

Rivet Agent OS的核心并非直接管理硬件的传统内核,而是一个运行时环境与抽象层。它将底层主机(云虚拟机、裸金属服务器、边缘设备)视为计算、内存和I/O资源的提供者。智能体——即包含模型、推理逻辑和工具使用能力的AI应用——被编译成WebAssembly模块。

其精妙之处在于一个多层架构:
1. 以V8隔离实例为基石:每个智能体运行在独立的V8隔离实例中。隔离实例是V8 JavaScript引擎的一个轻量级、独立实例,拥有自己的堆内存。它在不同智能体之间提供内存安全与隔离,但其创建和销毁速度比Linux容器或虚拟机快几个数量级。这正是实现6毫秒冷启动的主要来源。
2. 以WebAssembly作为可移植字节码:智能体逻辑被编译为Wasm。这默认提供了一个安全的沙箱执行环境,其能力通过WASI标准显式授予。Wasm通过V8内部的前期编译或即时编译优化实现接近原生的性能,确保了智能体代码本身的高效运行。
3. 通过系统接口实现I/O:智能体与外部世界的交互——读取文件、发起网络调用、使用GPU——均通过WASI进行中介。Rivet很可能扩展了标准WASI,加入了为AI工作负载定制的自定义“超级调用”,例如低延迟的智能体间通信、访问托管模型API(如OpenAI、Anthropic)或张量运算。
4. 编排层:在隔离实例运行时之上,Rivet提供了调度、生命周期管理、状态持久化和可观测性等编排功能,类似于一个极简的、专注于智能体的Kubernetes。

与其他智能体运行时项目的对比至关重要。`wasmCloud`是一个更广泛的、基于参与者模型的Wasm微服务框架,它可以托管智能体,但并非为AI优化。`wasmEdge`是一个高性能Wasm运行时,常用于无服务器和边缘计算,Rivet未来可能将其作为V8的替代引擎使用。Rivet的差异化在于其专注于AI智能体这一特定角色,并与V8的隔离模型紧密集成,以实现最大密度。

| 运行时环境 | 冷启动延迟(约) | 单实例内存开销 | 隔离模型 | 主要用例 |
|---|---|---|---|---|
| Rivet Agent OS (V8隔离实例) | 6 毫秒 | ~5-10 MB | 语言运行时 (V8) | AI智能体,无服务器函数 |
| Docker容器(预热) | 50-500 毫秒 | 50-100 MB | 操作系统级 (cgroups/namespaces) | 通用微服务 |
| Docker容器(冷启动) | 1-10 秒 | 50-100 MB+ | 操作系统级 | 通用微服务 |
| AWS Lambda (Firecracker微虚拟机) | 50-100 毫秒 | ~50 MB | 硬件虚拟化 (KVM) | 无服务器函数 |
| gVisor沙箱 | 100-200 毫秒 | 20-30 MB | 用户空间内核 | 安全容器 |

数据启示:上表揭示了Rivet在启动延迟和内存占用上具有数量级优势,这直接转化为成本效益和承载数千个并发瞬时智能体的能力。这使其特别适用于涉及大规模扇出、快速序列化工具调用或亚秒级交互响应的智能体模式。

关键参与者与案例研究

专用智能体基础设施的发展正吸引着从云超大规模厂商到雄心勃勃的初创公司在内的多元化参与者。

云服务商的战略布局:
* 微软:通过其与OpenAI的合作及GitHub Copilot,深度投入智能体生态系统。其Azure Container AppsAzure Functions支持自定义处理程序,可能允许托管类似Rivet的运行时。更具启示性的是,微软研究院的Project Freta以及基于Wasm的机密计算研究工作,暗示了一个未来:安全、可验证的智能体将成为云平台的一等公民。
* 谷歌:通过V8(Chromium的JavaScript引擎,也是开源的)与Rivet的隔离技术有最直接的技术邻接性。谷歌云的Cloud RunCloud Functions可能采用类似的隔离技术以在冷启动性能上竞争。谷歌的ChromeOS和边缘计算计划也为轻量级智能体运行时提供了天然的落地场景。
* AWS:凭借Lambda及其Firecracker微虚拟机技术,目前设定了无服务器领域的行业标准。虽然性能出色,但对于毫秒级任务,Firecracker的开销仍然显著。AWS的Bottlerocket操作系统以及在Lambda中通过WASI预览版对Wasm的投资,表明他们正在探索这一前沿领域。对Rivet的竞争性回应可能包括为Wasm优化Firecracker,或推出新的基于隔离实例的服务层级。

初创公司与开源项目:
* Rivet-dev:该项目背后的团队似乎瞄准的是基础设施底层。他们的成功取决于开发者的采纳以及能否围绕其运行时构建起强大的生态系统。其挑战在于提供足够丰富的工具链、调试支持和与现有AI工具(如LangChain、LlamaIndex)的无缝集成。
* 更广泛的生态中,其他专注于AI智能体编排、状态管理或特定垂直领域(如自主编码、客户服务)的初创公司,都可能成为Rivet Agent OS的上层用户或合作伙伴,利用其高性能底层来构建自己的差异化产品。

总体而言,Rivet Agent OS的出现标志着AI基础设施竞赛进入了一个新阶段,焦点从单纯的算力供给转向了为智能体工作负载量身定制的、极致高效的执行环境。这场变革将深刻影响未来AI应用的开发、部署与规模化方式。

更多来自 GitHub

GameNative开源革命:PC游戏如何挣脱束缚,登陆安卓由开发者Utkarsh Dalal主导的GameNative项目,代表了游戏串流生态中一场重要的草根运动。与将用户锁定在特定平台或订阅模式的专有服务不同,GameNative提供了一套工具,能在用户自己的游戏PC与安卓手机或平板之间搭建一座Plumerai 突破性研究撼动 BNN 根基:潜藏全精度权重真是必需吗?GitHub 仓库 `plumerai/rethinking-bnn-optimization` 是一篇旨在重新定义二进制神经网络训练方式的学术论文的官方实现。BNN 将权重和激活值限制为 +1 或 -1,能显著减少模型大小和计算成本,非常MIT开源TinyML知识库:拆解边缘AI,从理论到嵌入式实战`mit-han-lab/tinyml`知识库代表了学术界最具影响力的高效AI研究团队之一所做出的重要教学贡献。该项目并未提供另一个生产框架,而是精心策划并展示了使机器学习模型能够在内存、算力和功耗严格受限的微控制器、传感器等边缘设备上运行查看来源专题页GitHub 已收录 637 篇文章

时间归档

April 2026985 篇已发布文章

延伸阅读

ClawRouter以亚毫秒级AI路由与链上支付,重塑智能体基础设施格局ClawRouter已成为OpenClaw生态中的关键基础设施组件,它从根本上重构了AI智能体访问和支付大语言模型能力的方式。通过将覆盖41个以上模型的亚毫秒级路由与基于区块链的USDC无缝支付相结合,它打造了首个真正面向智能体原生、具备金GameNative开源革命:PC游戏如何挣脱束缚,登陆安卓GitHub星标超5000的开源项目GameNative,正悄然引领游戏串流领域的范式转移。它通过定制化的客户端-服务器架构,让玩家能将Steam、Epic、GOG和亚马逊等平台的整个PC游戏库直接串流至安卓设备,为封闭花园式的解决方案提供Plumerai 突破性研究撼动 BNN 根基:潜藏全精度权重真是必需吗?Plumerai 的最新研究对二进制神经网络训练的一个基础概念发起了挑战:潜藏全精度权重的存在必要性。该研究提出了一种直接优化方法,有望简化 BNN 开发流程,并为从微控制器到智能手机等边缘设备上的超高效 AI 解锁新的性能水平。MIT开源TinyML知识库:拆解边缘AI,从理论到嵌入式实战MIT韩松实验室近日发布了一个全面的TinyML开源知识库,堪称在资源受限设备上部署AI的“大师课”。这一教育平台系统性地弥合了神经网络压缩前沿研究与嵌入式硬件现实之间的鸿沟,为工程师和研究人员在蓬勃发展的边缘AI领域提供了关键导航图。

常见问题

GitHub 热点“Rivet Agent OS: The WebAssembly-Powered Revolution in AI Agent Infrastructure”主要讲了什么?

The Rivet Agent OS project, hosted on GitHub under rivet-dev/agent-os, introduces a paradigm shift in how AI agents are deployed and executed. Positioned as a portable, open-source…

这个 GitHub 项目在“Rivet Agent OS vs Docker performance benchmark”上为什么会引发关注?

At its core, Rivet Agent OS is not a traditional kernel managing hardware directly. Instead, it is a runtime environment and abstraction layer that treats the underlying host (cloud VM, bare metal, edge device) as a prov…

从“how to deploy AI agent with WebAssembly”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 2662,近一日增长约为 934,这说明它在开源社区具有较强讨论度和扩散能力。