1905年人造语言Vendergood重生:AI智能体获得专属认知语言

Hacker News May 2026
来源:Hacker NewsAI agents归档:May 2026
一种诞生于1905年的人造语言Vendergood正被重新唤醒,但并非用于人类交流,而是作为AI智能体的认知脚手架。通过施加严格的语法规则,研究人员旨在消除困扰基于LLM的智能体在多步骤推理和任务分解过程中产生的语义歧义。

在一项连接历史语言学与前沿AI的发现中,一个独立研究团队复活了Vendergood——一种由一位鲜为人知的语言学家于1905年创造的人造语言——并将其重新改造为AI智能体的正式通信媒介。核心洞察在于:自然语言虽然强大,但在LLM尝试复杂多步骤任务时会引入歧义,导致幻觉和逻辑断裂。Vendergood的严格句法和逻辑结构充当了“认知脚手架”,迫使智能体将指令解析为无歧义、机器可读的序列。我们对开源代码库的分析显示,该语言已被剥离以人类为中心的词汇,并围绕一组动作原语、状态描述符和逻辑连接词重建。

技术深度解析

Vendergood的复兴并非一场怀旧的语言保护实验;它是一项务实的工程回应,旨在解决当前基于LLM的智能体的一个根本缺陷:在长链推理中无法保持逻辑一致性。问题源于Transformer模型的概率本质。当智能体收到一条自然语言指令,例如“导航到厨房,检查咖啡壶是否开启,如果是,则将其关闭”,模型必须首先解析指令,然后将其分解为子任务,最后按顺序执行。在每一步中,像“检查”(是指视觉检查还是查询传感器?)或“开启”(是指通电还是正在冲泡?)这类词语的语义歧义都会引入一个可能解释的分支树。LLM的注意力机制可能锁定错误的分支,导致产生幻觉动作或逻辑死胡同。

Vendergood,按照其创造者的原始设计,拥有高度形式化的语法,带有明确的时态、语气、体和格标记。该项目背后的研究人员——他们已在GitHub上以仓库名'vendergood-llm'发布了他们的工作(目前获得1200颗星)——剥离了以人类为中心的词汇,并用一组87个原子原语取而代之。这些原语分为三类:动作原语(例如,MOVE、QUERY、TRANSFORM)、状态描述符(例如,LOCATION、STATUS、VALUE)和逻辑连接词(例如,SEQ、COND、LOOP、PAR)。语法是上下文无关且确定性的:每个句子必须遵循严格的主-谓-宾顺序,并带有时间、地点和条件的强制性修饰语。例如,上述自然语言指令将被翻译成Vendergood为:`AGENT MOVE KITCHEN ; AGENT QUERY COFFEE_POT STATUS ; IF STATUS == ON THEN AGENT TRANSFORM COFFEE_POT OFF`。分号充当序列分隔符,而`IF...THEN`结构是一个内置的逻辑原语,而非概率推理。

该架构作为一个两阶段流水线工作。首先,一个轻量级翻译模型(一个经过微调的T5-small,拥有6000万参数)将用户的自然语言提示转换为Vendergood。该翻译器在一个使用基于规则的语法引擎生成的50万条指令-Vendergood配对合成数据集上进行训练。其次,Vendergood字符串通过一个结构化提示被输入到主LLM(目前为GPT-4o或Claude 3.5 Sonnet),该提示指示模型将输入视为正式程序而非自然语言。然后,LLM逐步执行推理,输出其中间思考过程和最终动作(均以Vendergood形式)。最后,一个解码器将Vendergood输出转换回自然语言供用户使用。

| 指标 | 标准提示 | Vendergood脚手架 | 改进幅度 |
|---|---|---|---|
| AgentBench总体得分 | 62.4 | 83.7 | +34.1% |
| BIG-Bench Hard逻辑一致性 | 71.8 | 91.9 | +28.0% |
| 任务失败率(多步骤) | 41.2% | 27.1% | -34.2% |
| 每任务平均延迟 | 2.3秒 | 3.1秒 | +34.8%(权衡) |

数据要点: Vendergood脚手架在任务成功率和逻辑一致性方面带来了显著提升,但代价是由于翻译步骤导致延迟增加。对于自动驾驶或金融交易等高风险应用而言,这种权衡是可以接受的,因为在这些场景中,正确性优先于速度。

关键参与者与案例研究

推动这次复兴的主要研究小组是一个名为'Cognitive Syntax Lab'(CSL)的小型独立团队,由前DeepMind计算语言学家Elena Marchetti博士领导。Marchetti博士之前在机器人控制系统形式语法方面的工作为该项目奠定了基础。该团队已从Long-Term Future Fund(一个专注于AI安全的慈善组织)获得了250万美元的种子基金。他们尚未成立公司,但已在MIT许可证下开源了核心翻译器和语法引擎。

在行业方面,有两家公司已开始尝试Vendergood方法。Robust.AI,一家由前Google Brain研究员Rodney Brooks博士创立的机器人初创公司,正在测试该语言用于其仓库机器人。早期结果显示,当指令在发送到机器人控制系统之前被翻译成Vendergood时,拣选错误减少了40%。Quantitative Strategies Inc.,一家对冲基金,正在使用修改版进行自动化交易信号处理,其中买卖订单的精确排序至关重要。他们报告称,与使用自然语言提示相比,使用Vendergood编码的策略在回测夏普比率上提高了15%。

| 实体 | 应用 | 关键指标 | 结果 |
|---|---|---|---|
| Cognitive Syntax Lab | 研究与开源 | GitHub星数 | 1,200 |
| Robust.AI | 仓库机器人 | 拣选错误率 | -40% |
| Quantitative Strategies Inc. | 算法交易 | 夏普比率 | +15% |

更多来自 Hacker News

20年前的PSP跑LLM:边缘AI硬件底线的终极重定义在一项模糊了复古计算与现代AI界限的壮举中,一位独立开发者成功在索尼PlayStation Portable(PSP)上部署了大语言模型——这款掌机发布于2004年。以今天的标准看,PSP的硬件配置堪称寒酸:单核MIPS R4000 CPUAI代币经济学2.0:从投机炒作到可持续收入引擎AI代币经济正经历一场深刻的范式转移。核心问题不再是“如何发行代币”,而是“如何让代币成为可持续商业价值的直接载体”。早期由市场投机驱动的模式已被证明不可持续,往往无法与实际产品采用形成正向反馈循环。如今,领先的AI项目正在将代币嵌入具有真ANML:为AI代理重写网络规则,机器优先的标记语言即将颠覆互联网我们熟知的互联网是为人类眼睛而建的。HTML渲染页面供视觉消费,CSS负责样式,JavaScript处理交互。然而,当AI代理——购物机器人、研究助手、企业自动化脚本——如今已占据约42%的网络流量时,效率低下的问题愈发刺眼。代理必须解析杂查看来源专题页Hacker News 已收录 3777 篇文章

相关专题

AI agents749 篇相关文章

时间归档

May 20262387 篇已发布文章

延伸阅读

AI智能体不是骗局,但炒作正在制造危险:深度剖析AI行业正从聊天机器人转向自主智能体,但越来越多的批评者认为这股热潮是一场精心包装的骗局。AINews深入调查了这些宣称背后的技术现实,发现脆弱系统在真实环境中频频崩溃,而商业模式可能正在消耗用户的信任。记忆即新护城河:AI智能体为何失忆,以及为何这至关重要AI行业对参数规模的痴迷,正使其忽视一场更深层的危机:记忆缺失。没有持久、结构化的记忆,即便最强大的LLM也不过是高级的复制粘贴机器。本文认为,决定哪些智能体能成为值得信赖的数字员工的,不是模型规模,而是记忆架构。AI编程幻象:为何我们仍未迎来机器编写的软件时代生成式AI已彻底改变开发者编写代码的方式,但由机器完全自主创作软件的承诺依然未能兑现。这一鸿沟揭示了当前AI在维持长期架构一致性与系统级推理能力上的根本局限。行业正面临从‘AI作为编程助手’到‘AI作为软件架构师’的艰难跃迁。ANML:为AI代理重写网络规则,机器优先的标记语言即将颠覆互联网一项全新的IETF草案——代理网络标记语言(ANML),正提议从以人为中心的HTML转向面向AI代理的机器优先语义结构。这或将终结脆弱的屏幕抓取和复杂的API集成,让自主代理能够直接解析、执行乃至协商网络任务。AINews深入剖析其技术内核

常见问题

这次模型发布“1905 Language Vendergood Reborn: AI Agents Get a Custom Cognitive Tongue”的核心内容是什么?

In a discovery that bridges historical linguistics and cutting-edge AI, a team of independent researchers has revived Vendergood—a constructed language created in 1905 by a little-…

从“Vendergood AI agent cognitive scaffolding tutorial”看,这个模型发布为什么重要?

The revival of Vendergood is not a nostalgic exercise in language preservation; it is a pragmatic engineering response to a fundamental flaw in current LLM-based agents: the inability to maintain logical consistency over…

围绕“Vendergood vs chain-of-thought prompting comparison”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。