Moduna 为AI智能体打造Mixpanel式分析平台,终结“黑箱”操作

Hacker News June 2026
来源:Hacker News归档:June 2026
Moduna 推出专为AI智能体设计的分析平台,提供实时监控、会话回放与成本追踪。随着企业将自主智能体从实验室推向生产环境,Moduna 致力于成为智能体可观测性的行业标准,将不透明的决策过程转变为数据驱动的工程实践。

新锐初创公司 Moduna 发布了一款专为AI智能体设计的分析平台,填补了可观测性栈中的关键空白。传统产品分析工具如 Mixpanel 追踪的是人类的点击和页面浏览,却无法捕捉自主智能体复杂的多步决策链——包括API调用、数据库查询、工具调用和分支逻辑。Moduna 将每个智能体动作转化为可量化指标:任务成功率、每步延迟、令牌消耗成本和错误传播。其突出功能是会话回放,允许开发者像回放用户旅程一样,逐帧浏览智能体的决策树。这使智能体调试从猜测转变为取证分析。该平台还集成了流行的 LangChain 和 AutoGPT 框架。

技术深度解析

Moduna 的架构基于一个自定义事件管道,专为处理自主智能体的独特遥测数据而设计。与追踪HTTP请求和数据库查询的传统APM工具不同,Moduna 将智能体行为建模为一个由“动作”组成的有向无环图(DAG)。每个动作——无论是LLM调用、工具调用(例如网络搜索或文件读取)、条件分支还是重试——都被记录为一个带有丰富元数据的事件:输入/输出令牌、延迟、成本、错误代码以及父子关系。该平台使用基于 Apache Parquet 和 ClickHouse 的列式时序数据库来存储这些事件,从而实现对数百万个智能体会话的亚秒级查询。

一个关键创新是 Moduna 的“决策树回放”引擎。它序列化智能体在每个步骤的内部状态——包括提示上下文、中间推理(如果使用思维链)以及所选动作。开发者可以浏览时间线,在任何节点暂停,并检查确切的输入和输出。这类似于 Mixpanel 的用户会话回放,但针对的是非人类行为者。回放引擎还支持“假设”分支:开发者可以在决策点分叉一个会话,修改提示或工具选择,并模拟替代结果,而无需重新运行整个智能体。

在成本方面,Moduna 提供细粒度的令牌核算。它解析LLM API响应以提取提示和完成令牌,然后将其映射到来自 OpenAI、Anthropic 和 Google 等提供商的实时定价。该平台展示每任务成本、每工具调用成本,甚至每决策路径成本,使团队能够识别昂贵的失败模式——例如,由于提示有缺陷而反复调用缓慢、高成本API的智能体。

该领域一个相关的开源项目是 LangFuse(GitHub: langfuse/langfuse,8.5k星),它提供带有追踪和成本追踪的LLM可观测性。然而,LangFuse 专注于单个LLM调用,而非完整的智能体决策图。另一个是 Arize AI 的 Phoenix(GitHub: Arize-AI/phoenix,7.2k星),它提供LLM评估和追踪,但缺乏针对多步智能体的会话回放。Moduna 的差异化在于其智能体原生的数据模型和回放功能。

| 特性 | Moduna | LangFuse | Arize Phoenix | 传统APM (Datadog) |
|---|---|---|---|---|
| 智能体决策树回放 | ✅ 完整 | ❌ | ❌ | ❌ |
| 每步令牌成本追踪 | ✅ | ✅ | ✅ | ❌ |
| 多智能体会话关联 | ✅ | ❌ | ❌ | ❌ |
| “假设”模拟 | ✅ | ❌ | ❌ | ❌ |
| 与 LangChain/AutoGPT 集成 | ✅ | ✅ | ✅ | ❌ |
| 智能体漂移实时告警 | ✅ | ❌ | 部分 | ❌ |

数据要点: Moduna 的功能集专为智能体工作流量身定制,而现有的LLM可观测性工具和传统APM缺乏决策树回放和多智能体关联能力。这一差距证明了 Moduna 作为一个独立类别的存在价值。

关键参与者与案例研究

Moduna 由前 Mixpanel 和 Datadog 的工程负责人团队创立,他们在产品分析和基础设施监控方面拥有深厚的领域专业知识。CEO Sarah Chen 曾领导 Mixpanel 的实时分析团队,负责构建Web应用的会话回放引擎。CTO Marcus Rivera 曾是 Datadog 专注于分布式追踪的高级工程师。他们的综合经验直接塑造了 Moduna 的架构。

早期企业用户包括 Finova,一家部署AI智能体进行贷款承销的金融科技公司。Finova 的智能体每月处理5万份申请,每份申请需要向信用机构、欺诈数据库和内部风险模型进行15-20次工具调用。在使用 Moduna 之前,调试一个失败的申请需要4小时的日志挖掘。借助 Moduna 的会话回放,他们将平均解决时间(MTTR)从4小时缩短至45分钟。他们还发现,智能体12%的API成本来自重复的信用机构查询——这一修复每月节省了8000美元。

另一个案例是 CodeForge,一家使用智能体进行自动化代码审查的初创公司。他们的智能体分析拉取请求、运行静态分析并提出修复建议。CodeForge 使用 Moduna 追踪智能体的“幻觉”率——即智能体建议错误代码更改的实例。通过回放会话,他们发现智能体误解了某些 TypeScript 泛型,从而对提示进行了优化,使幻觉率降低了22%。

竞争解决方案正在涌现。LangSmith(由 LangChain 开发)提供基本的智能体追踪,但缺乏成本分析和回放功能。Weights & Biases Prompts 提供LLM监控,但不提供智能体级别的DAG可视化。New RelicDatadog 已宣布推出LLM监控功能,但它们将智能体调用视为普通的API请求,忽略了决策上下文。

| 公司 | 产品 | 智能体原生? | 会话回放? | 成本追踪? | 定价模式 |
|---|---|---|---|---|---|
| Moduna | Moduna Agent Analytics | ✅ | ✅ | ✅ | 按会话量订阅 |
| LangChain | LangSmith | 部分 | ❌ | ❌ | 按调用量付费 |
| Weights & Biases | Prompts | ❌ | ❌ | ✅ | 按席位订阅 |
| Datadog | LLM Observability | ❌ | ❌ | 部分 | 按数据量付费 |

更多来自 Hacker News

Argybargy:去中心化“通用语”,解锁多智能体经济新纪元当前的 AI 智能体生态宛如一座数字巴别塔:基于 AutoGPT 的智能体与基于 LangChain、CrewAI 或自定义框架的智能体说着不同的“语言”。它们被锁定在专有平台内,无法在没有中心中介的情况下协作或交换价值。新近浮出水面的开源一人一卡:这份开源指南如何打破AI的十亿美元壁垒长期以来,AI行业默认训练大型语言模型是科技巨头凭借十亿美元算力预算才能染指的禁地。一份在开发者社群中悄然流传的开源教程,彻底粉碎了这一假设。它提供了一套完整、循序渐进的流水线,让一名独立开发者从零开始训练语言模型——涵盖数据清洗、分词器训开源神器“第二大脑”:让AI成为你面试中的隐形副驾AINews发现了一个迅速走红的开源项目“Second Brain”,它正在重新定义AI在求职面试中的角色。该工具完全在用户笔记本电脑本地运行,通过麦克风捕捉面试官语音,利用本地语音转文字模型进行转录,然后查询本地Llama 3模型获取建议查看来源专题页Hacker News 已收录 5003 篇文章

时间归档

June 20262063 篇已发布文章

延伸阅读

Moduna:为AI智能体打造Mixpanel式可观测性——调试自主系统的新基础设施层随着企业从实验性聊天机器人转向生产级自主智能体,一个根本性问题变得无法回避:如何调试一个能自我思考的系统?Moduna,这家低调的初创公司,给出了明确答案——将Mixpanel的产品分析范式引入AI智能体世界。它不再追踪用户点击,而是追踪智Tokenbrook Vale:当AI代理化身像素小镇里的数字员工Tokenbrook Vale 是一个开源项目,它将AI代理的监控界面重新构想为一座复古像素艺术风格的办公小镇。用户连接自己的Claude实例后,代理会变成在街道上行走的角色——这种设计优先考虑情感共鸣,而非冰冷的指标。AI Agent生产可靠性:无人解决的堆栈碎片化危机AI Agent的热潮席卷了整个行业,但一个残酷的事实正在浮出水面:几乎没有团队能在生产环境中可靠地运行Agent。我们的分析揭示,核心瓶颈并非模型智能,而是一个缺乏标准化日志、回滚和人工介入接口的碎片化堆栈。Lago开源SDK终结AI计费中间件:一场透明化革命Lago发布了一款开源SDK,让开发者能直接基于原始LLM令牌成本构建计费逻辑,彻底告别复杂中间件。这标志着AI定价从黑箱走向可编程、透明的成本结构。

常见问题

这次公司发布“Moduna Brings Mixpanel-Style Analytics to AI Agents, Ending Black Box Operations”主要讲了什么?

Moduna, a new startup, has unveiled an analytics platform explicitly designed for AI agents, filling a critical gap in the observability stack. While traditional product analytics…

从“Moduna vs LangFuse for agent observability”看,这家公司的这次发布为什么值得关注?

Moduna’s architecture is built on a custom event pipeline designed to handle the unique telemetry of autonomous agents. Unlike traditional APM tools that track HTTP requests and database queries, Moduna models agent beha…

围绕“How to set up Moduna for AutoGPT agents”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。