Tesseron颠覆AI Agent控制逻辑:开发者划定边界,拒绝黑箱决策

Hacker News April 2026
来源:Hacker News归档:April 2026
Tesseron发布全新AI Agent API框架,彻底反转传统控制流:不再是Agent自主决定调用哪些工具,而是由应用开发者预先定义严格的行为边界。这一设计旨在让AI Agent变得可预测、安全且可组合,有望弥合实验性Demo与生产级系统之间的鸿沟。

当前AI Agent生态系统的核心矛盾在于灵活性与确定性之间的博弈。LangChain、AutoGPT、CrewAI等主流框架赋予模型极大的自主权,让它们自行选择工具并编排工作流。虽然这能催生令人印象深刻的演示效果,但也带来了不可预测性、安全漏洞(例如提示注入导致意外工具调用)以及审计困难等问题。Tesseron的方案是一次根本性的架构重构:开发者编写一份API契约——一个包含允许操作、参数和业务逻辑的精确模式——而Agent则严格在该沙箱内运行。这不仅仅是一个安全包装层,更是Agent推理范式的转变。Agent不再“决定”使用哪个工具,而是从一个预先授权的菜单中进行选择。

技术深度解析

Tesseron的架构围绕一个名为“行为API契约”(Behavioral API Contracts,简称BAC)的概念构建。与传统Agent框架(模型接收工具描述列表,然后利用内部推理选择其一)不同,Tesseron在模型与工具之间插入了一个确定性的“策略引擎”。开发者通过YAML或JSON模式定义以下内容:

- 允许的操作:一个有限的操作集合(例如 `search_catalog`、`check_inventory`、`place_order`)。
- 参数约束:针对每个操作,开发者定义必填字段、数据类型和取值范围(例如 `quantity` 必须是1到10之间的整数)。
- 执行顺序:可选地,定义一个允许工作流的有向无环图(DAG)(例如 `check_inventory` 必须在 `place_order` 之前执行)。
- 回退行为:当请求模糊或违反约束时,Agent应执行的操作——例如请求澄清、升级到人工处理,或返回默认响应。

Agent的LLM(目前支持GPT-4o、Claude 3.5,以及通过插件接口支持Llama 3等开源模型)仅用于自然语言理解和生成。实际的工具调用由策略引擎处理,该引擎在执行前根据BAC验证每一次调用。这消除了“幻觉工具调用”——即Agent凭空捏造不存在的函数或误用参数这一常见故障模式。

GitHub参考:开源仓库 `tesseron/tesseron-api-spec`(截至2026年4月已获2.3k星标)包含一个Python SDK、一个基于Rust实现的高性能策略引擎参考实现,以及一个用于本地测试BAC的命令行工具。Rust引擎使用基于Z3 Prover的形式化验证模块,检查开发者约束中的逻辑矛盾——例如,如果一条规则规定“始终将超过1000美元的订单升级处理”,而另一条规则规定“自动批准所有订单”,引擎将拒绝部署。

性能基准测试:在内部测试中,Tesseron Agent在相同任务上的延迟比等效的LangChain Agent低40%,因为策略引擎绕过了LLM的工具选择推理循环。然而,在“为模糊查询找到最佳产品”等开放式任务上,受约束模型的得分低了12%——这是一个可预见的权衡。

| 指标 | Tesseron(受约束) | LangChain(自主) | 差异 |
|---|---|---|---|
| 工具调用准确率 | 99.2% | 87.4% | +11.8% |
| 每次调用平均延迟 | 320ms | 530ms | -39.6% |
| 边缘情况成功处理率 | 68% | 82% | -14% |
| 安全事件(每万次调用) | 0.2 | 4.7 | -95.7% |

数据要点:Tesseron的约束方法以牺牲灵活性为代价,显著提升了可靠性和安全性。对于一致性至关重要的生产系统而言,这是一个有利的权衡。仅延迟改进一项——接近40%——就为高吞吐量的企业部署提供了有力论据。

关键参与者与案例研究

Tesseron由一群前Google和前AWS工程师创立,他们曾参与Borg(Google的集群管理器)和AWS Step Functions的开发。他们在确定性编排方面的背景在框架设计中体现得淋漓尽致。该公司已从包括红杉资本和一家隐身模式的国防承包商在内的财团获得了1200万美元的种子轮融资。

竞争方案对比

- LangChain:最流行的开源Agent框架。它赋予模型高度自主权,但依赖事后添加的“回调”和“护栏”。LangChain的LangSmith产品增加了可观测性,但并未提供部署前的约束执行。
- CrewAI:专注于多Agent协作,但同样缺乏正式的约束层。Agent仍然可能在整个团队中产生幻觉工具调用。
- Microsoft AutoGen:提供了一个带有部分人机协作功能的对话式Agent框架,但模型仍然主导工具选择。
- OpenAI的Function Calling:最接近的原生替代方案——开发者定义函数模式,但模型仍然决定调用哪个函数。不强制执行执行顺序或业务规则。

| 框架 | 约束执行 | 执行顺序控制 | 形式化验证 | 开源 |
|---|---|---|---|---|
| Tesseron | 是(策略引擎) | 是(基于DAG) | 是(Z3 Prover) | 是 |
| LangChain | 否(事后护栏) | 否 | 否 | 是 |
| CrewAI | 否 | 部分(顺序任务) | 否 | 是 |
| AutoGen | 否 | 否 | 否 | 是 |
| OpenAI Function Calling | 否 | 否 | 否 | 否 |

数据要点:Tesseron是唯一一个在执行层面强制执行约束的框架,而非依赖模型的合规性。这是一个根本性的架构差异,而非一个功能开关。

案例研究——金融科技初创公司“ClearPay”:ClearPay是一家先买后付服务提供商,部署Tesseron来处理客户退款请求。此前,他们的LangChain Agent偶尔会因幻觉工具调用而发放超过原始购买金额的退款,导致财务损失。迁移到Tesseron后,ClearPay在BAC中定义了严格的退款规则:退款金额不得超过原始交易金额,且必须经过双重验证。部署后,ClearPay报告称退款错误率降至零,同时处理时间缩短了35%。

更多来自 Hacker News

Nvidia「野兽级」CPU计划:重塑Windows PC架构,开启AI原生计算时代Nvidia雄心勃勃的「野兽级」Windows PC CPU计划,代表着个人计算架构的根本性转变。该公司正利用其最初为数据中心超级芯片开发的Grace CPU架构,并结合统一内存互连技术,打破CPU、GPU和NPU之间的传统壁垒。这种设计理Sawtooth记忆框架:异步召回终结LLM智能体“卡顿”之痛Sawtooth记忆框架现已作为开源项目发布,它从根本上重构了LLM智能体管理过往信息的方式。传统方法将记忆视为单一的向量存储或简单的对话缓存,迫使智能体在每次需要检索历史上下文时暂停推理,形成“检索即卡顿”的恶性循环,严重限制了智能体可处标普500盈利规则封杀SpaceX、OpenAI、Anthropic:新资本生态正在崛起标普500指数拒绝SpaceX、OpenAI和Anthropic,并非对其技术实力的否定,而是鲜明地揭示了传统金融基础设施在容纳那些价值创造以年而非季度衡量的公司时,所面临的困境。该指数要求连续四个季度实现GAAP正净利润——这一规则本是为查看来源专题页Hacker News 已收录 4244 篇文章

时间归档

April 20263042 篇已发布文章

延伸阅读

Cognizant CEO炮轰TokenMaxxing是虚荣指标,豪招2万毕业生重塑AI价值Cognizant首席执行官Ravi Kumar公开将AI行业对TokenMaxxing的痴迷斥为“虚荣指标”,并宣布大规模招聘2万名毕业生。这一大胆举动挑战了“模型越大,AI越强”的主流教条,将行业焦点重新拉回实际部署与人机协作。Skawld开源SDK:让每家公司都能打造专属的AI智能体大脑Skawld,一款开源SDK,允许任何组织利用专有数据和工作流构建定制化AI智能体。AINews分析这一模块化框架如何可能使企业级AI开发民主化,将智能体市场从通用聊天机器人转向深度专业化的数字员工。Phylax:每个自主AI Agent上线前必备的文件安全锁Phylax是一个轻量级权限拦截层,能实时监控AI Agent发出的每一次文件操作请求,在系统与Agent之间构建一道行为约束引擎。它无需虚拟化即可部署,为企业与个人提供Agent自主运行的基础安全网。零人类参与:AI智能体团队独立构建并运营的微型SaaS——TalkTimer案例深度解析TalkTimer,一款用于现场活动的舞台计时器,不仅代码由AI编写,其构思、构建、部署乃至日常维护,均由一支自主AI智能体团队完成,全程无任何人类介入。这一实验标志着AI从“工具”向“独立团队”的激进转变,正在挑战软件开发和SaaS经济学

常见问题

这次公司发布“Tesseron Flips AI Agent Control: Developers Define Boundaries, Not Black Boxes”主要讲了什么?

The core tension in today's AI agent ecosystem is flexibility versus determinism. Current frameworks like LangChain, AutoGPT, and CrewAI grant models significant autonomy to choose…

从“Tesseron vs LangChain for enterprise agents”看,这家公司的这次发布为什么值得关注?

Tesseron's architecture is built around a concept they call 'Behavioral API Contracts' (BAC). Unlike traditional agent frameworks where the model receives a list of tool descriptions and uses its internal reasoning to pi…

围绕“How to define behavioral API contracts for AI agents”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。