Katanemo推出Plano:AI原生基础设施层,或将解锁生产级智能体系统

GitHub April 2026
⭐ 6332📈 +202
来源:GitHubAI agentsLLM orchestrationmulti-agent systems归档:April 2026
前AWS首席工程师创立的初创公司Katanemo近日开源了Plano项目,这是一个专为AI智能体设计的原生代理与数据平面。它旨在通过抽象编排、安全、可观测性及LLM路由等复杂底层逻辑,让开发者能聚焦于智能体业务逻辑本身,为构建复杂、生产级的智能体应用提供缺失的基础设施层。

随着大型语言模型日益精进,构建实用、自主的AI智能体已成为技术竞赛的焦点。然而,一个关键瓶颈始终存在:缺乏稳健、可扩展的基础设施来管理这些智能体系统所需的通信、协调与运维。由前AWS首席工程师创立的初创公司Katanemo,正通过开源项目Plano直面这一缺口。该项目迅速获得关注,已在GitHub上收获超过6,300颗星。

Plano的定位并非又一个智能体框架,而是底层的“数据平面”与“代理”层。其核心价值主张是为AI智能体混乱、分布式的运行时提供一个统一的控制点。它处理那些非差异化但至关重要的工作:在智能体、工具与LLM API之间路由请求,管理智能体实例的生命周期,执行安全与治理策略,并聚合全链路的可观测性数据。

这标志着智能体技术栈正在分层演进。在框架层,LangChain和LlamaIndex主导着快速原型构建与链式编排;在平台层,谷歌、微软、亚马逊等巨头提供了托管但往往有厂商锁定的环境。Plano则瞄准了新兴的基础设施层,旨在成为一个开放、可移植的底层基座,可以运行在本地、任何云或跨云环境中,同时与上层的框架和平台集成。其创始团队在构建大规模云原生分布式系统方面的深厚背景,为其带来了可信度。行业观察认为,其路径可能类似于HashiCorp等公司:先建立开源标准,构建社区,再推出功能增强、有支持服务的企业托管版本。

技术深度解析

Plano的架构围绕 AI原生数据平面 的概念构建。其核心是一个用Rust编写的高性能代理,选择Rust是看中其内存安全、并发支持和低延迟特性,这对实时智能体交互至关重要。该代理拦截所有在智能体、工具和LLM API之间的流量。在此数据平面之上,是一个用Python实现的控制平面,负责管理配置、策略执行和可观测性数据聚合。

关键的技术组件包括:

1. 智能LLM路由与故障转移:Plano实现了一套声明式路由系统。开发者可以基于成本、延迟、模型能力或自定义指标定义路由规则。例如,规则可以将所有分类任务路由到更经济的模型如GPT-3.5-Turbo,而将创意生成任务路由到Claude 3 Opus。至关重要的是,它支持自动故障转移——如果某个提供商宕机或达到速率限制,Plano可以无缝地将请求重新路由到备用方案。这是通过代理内部一个带健康检查的加权路由池实现的。

2. 内置编排引擎:与在提示词层面进行编排的高层框架不同,Plano在*服务*层面进行编排。它管理智能体实例的生命周期,通过发布-订阅或直接RPC模型处理智能体间通信,并在可能有状态的智能体交互中维护上下文/会话状态。它的编排重点不在于定义“链”,而在于管理自治服务的分布式运行时。

3. 基于策略的安全与治理:其策略引擎是一个核心特性。安全与合规规则(例如,“阻止智能体调用数据库写入工具”、“从所有日志中编辑个人身份信息”、“强制每个用户会话使用最大令牌预算”)被定义为代码(可能使用类似Open Policy Agent的Rego语言),并在代理层统一执行。这提供了一个关键的审计与控制点,否则这些规则将分散在应用代码中。

4. 统一可观测性:Plano为所有智能体活动发出结构化的追踪、指标和日志。它能自动追踪用户查询流经多个智能体和LLM调用的过程,提供类似于微服务中分布式追踪的统一视图。这对于调试复杂的、非确定性的智能体工作流以及进行成本归因至关重要。

| 基础设施维度 | 传统微服务代理(如Envoy) | Plano(AI原生代理) |
|---|---|---|
| 主要抽象对象 | HTTP/gRPC 服务 | AI智能体 & LLM端点 |
| 路由逻辑 | 主机/路径,请求头 | 模型能力、成本、延迟、令牌限制 |
| 可观测性焦点 | 延迟、HTTP状态码 | 令牌使用量、单次请求成本、LLM提供商错误、智能体步骤追踪 |
| 策略执行 | API密钥、速率限制、WAF | 提示词注入防护、输出内容过滤、工具使用策略、令牌预算 |
| 状态管理 | 无状态(会话粘性) | 针对多轮智能体对话的上下文/会话感知 |

核心洞察:此对比凸显了Plano的根本性转变:它理解AI工作负载的语义。其路由、可观测性和策略都是围绕AI原生概念(令牌、模型、提供商)构建的,而非通用的网络概念,从而提供了一个量身定制的基础设施层。

主要参与者与案例分析

智能体基础设施领域正逐渐分化为不同的层次。在框架层,LangChain和LlamaIndex主导着快速原型构建和链式编排。在平台层,谷歌、微软、亚马逊等公司提供了托管的、但往往有厂商锁定的环境。Plano则运作于新兴的基础设施层,旨在成为开放、可移植的底层基座,可以运行在任何地方——本地、任何云或跨云——同时与上层的框架和平台集成。

Katanemo的创始人,前AWS首席工程师,在构建大规模云原生分布式系统方面带来了深厚的信誉。他们的策略似乎是:先建立一个开源标准,构建社区,随后推出功能增强、有支持服务和更强可扩展性的企业托管版本——这是HashiCorp、Confluent等公司成功执行的模式。

直接竞争者正在浮现。Braintrust的AutoEval平台专注于智能体的评估与测试环节。Portkey是一个紧密的竞争对手,同样提供AI网关功能,包括路由、故障转移和可观测性,尽管其焦点更狭义地集中在LLM网关上,而非完整的智能体数据平面。Agno是另一个具有类似愿景的新进入者。未来的差异化将取决于性能、智能体特定功能的深度(如复杂的编排)以及开发者体验。

| 解决方案 | 主要焦点 | 编排能力 | 部署模型 |
|---|---|---|---|
| Plano (Katanemo) | AI原生基础设施层(数据平面/代理) | 服务级,分布式运行时管理 | 开源,可部署在任何地方 |
| Portkey | AI网关(LLM路由、可观测性) | 有限(主要关注LLM调用) | SaaS及自托管选项 |
| LangChain/LlamaIndex | 应用框架(链、智能体模板) | 提示词/链级编排 | 代码库,通常与平台结合 |
| AWS Bedrock Agents | 托管智能体平台 | 平台定义的工作流 | 完全托管,AWS云服务 |

更多来自 GitHub

VoxCPM2重塑语音合成:无分词器架构与多语言语音设计的革命VoxCPM2代表了神经文本转语音合成领域的范式转移,从根本上挑战了主导该领域多年的传统技术流程。由OpenBMB计划开发的这一模型,其核心创新在于“无分词器”设计,绕过了传统系统对复杂文本归一化与字素-音素转换模块的依赖。取而代之的是,它Clasp的CDCL革命:冲突驱动学习如何重塑答案集编程Clasp是现代答案集编程的基石,由Martin Gebser、Torsten Schaub等研究人员领导的Potassco项目开发而成。与传统ASP求解器依赖更直接的搜索算法不同,Clasp的创新在于它从布尔可满足性求解中引入了冲突驱动子Clingo的逻辑编程革命:ASP如何成为AI复杂推理的秘密武器Clingo是数十年声明式编程与知识表示研究的成熟结晶。它主要由波茨坦大学开发,是Potassco(波茨坦答案集求解集合)项目的旗舰组件,将实例化器(gringo)与求解器(clasp)集成到一个高度优化的统一系统中。与命令式编程要求开发者查看来源专题页GitHub 已收录 752 篇文章

相关专题

AI agents493 篇相关文章LLM orchestration18 篇相关文章multi-agent systems117 篇相关文章

时间归档

April 20261396 篇已发布文章

延伸阅读

微软Agent Framework:一场押注企业AI编排的战略豪赌微软正式推出Agent Framework,这是一个用于构建、编排和部署AI智能体与多智能体工作流的开源平台。该框架对Python和.NET提供同等优先支持,旨在通过连接两大开发者生态并承诺深度Azure集成,抢占蓬勃发展的企业自动化市场。AgentSkills横空出世:AI智能体互操作性的关键拼图开源规范AgentSkills正迅速崛起,有望解决AI领域最顽固的瓶颈——智能体互操作性。该项目已在GitHub收获超1.3万星标,旨在为AI智能体的能力描述创建通用语言,实现跨平台技能无缝共享。字节跳动发布Deer-Flow超级智能体框架,AI智能体开发范式迎来重大转向字节跳动正式推出开源超级智能体框架Deer-Flow,专为复杂长周期AI任务设计。该平台集成了沙箱执行、持久化记忆与多智能体协作能力,可处理从数分钟到数小时的研究、编程与创意工作流,标志着字节跳动在可扩展自主AI系统工程化上迈出关键一步。Dimos:物理空间的智能体操作系统与具身AI的未来一个名为Dimensional(Dimos)的全新开源项目正试图打造物理空间的通用操作系统。它通过实现跨硬件平台的自然语言控制与多智能体协同,旨在解决长期困扰机器人学与具身AI的碎片化难题,标志着我们向万物互联的智能物理世界迈出了关键一步。

常见问题

GitHub 热点“Katanemo's Plano: The AI-Native Infrastructure Layer That Could Unlock Production-Ready Agentic Systems”主要讲了什么?

The emergence of sophisticated large language models has ignited a race to build practical, autonomous AI agents. However, a critical bottleneck has persisted: the lack of robust…

这个 GitHub 项目在“Plano vs LangChain for production deployment”上为什么会引发关注?

Plano's architecture is built around the concept of an AI-native data plane. At its heart is a high-performance proxy written in Rust, chosen for its memory safety, concurrency support, and low-latency characteristics cr…

从“How to implement LLM fallback with Katanemo Plano”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 6332,近一日增长约为 202,这说明它在开源社区具有较强讨论度和扩散能力。