技术深度解析
Hyper的「公司大脑」并非简单地在LLM上嫁接一个RAG(检索增强生成)系统。它是一个专为解决困扰大多数企业AI部署的根本问题——陈旧上下文——而构建的多层架构。
其核心是一个实时事件流处理器。每一次集成——Slack消息、GitHub提交、Notion页面编辑、Jira工单更新——都通过webhook和API监听器被摄取。这些事件随后通过一个管道处理:
1. 摄取与标准化层:来自不同来源的原始数据(Slack线程、Markdown文档、代码差异)被解析为统一模式。例如,一条关于修复Bug的Slack消息会通过实体解析与相关的GitHub提交和Jira工单关联起来。
2. 动态知识图谱构建:与静态向量数据库不同,Hyper构建了一个时间知识图谱。节点代表实体(人员、项目、文档、代码模块),边代表带有时间戳的关系。这使得系统能够回答诸如「Sarah上周在#销售频道关于Q3定价模型说了什么?」这样的问题,而不会产生幻觉。
3. 上下文嵌入与检索:Hyper使用一个基于`text-embedding-3-large`变体微调的嵌入模型,该模型在企业特定数据上训练,以理解公司行话。检索机制不仅仅是top-k相似度;它融入了时效性加权和权威性评分(CTO关于架构决策的消息比初级工程师的随口评论权重更高)。
4. 代理编排层:这是奇迹发生的地方。Hyper的代理构建在一个自定义框架上,该框架使用函数调用来查询知识图谱。当代理被要求「起草一份关于登录Bug的客户投诉回复」时,它首先查询知识图谱以获取:关于该Bug的最新Slack讨论、相关的GitHub PR、客户历史记录以及公司的官方回复模板。然后,它将所有这些综合成一个连贯的行动。
一个关键的工程决策是混合存储架构。Hyper同时使用向量数据库(Pinecone)进行语义搜索和图数据库(Neo4j)进行关系遍历。这种双重方法既支持模糊检索(「查找与这份提案相似的文档」),也支持精确路径查询(「显示此功能的审批链」)。
| 特性 | Hyper「公司大脑」 | 通用RAG(如LlamaIndex) | 企业搜索(如Glean) |
|---|---|---|---|
| 实时摄取 | 是(亚秒级延迟) | 批量/定期 | 近实时(分钟级) |
| 时间感知 | 是(带时间戳的图谱) | 否 | 有限(索引时间戳) |
| 关系建模 | 完整知识图谱 | 扁平向量索引 | 轻量级图谱(实体提取) |
| 代理原生执行 | 是(内置编排) | 否(需自定义代码) | 否(仅搜索) |
| 上下文窗口管理 | 动态、多跳检索 | 固定块检索 | 静态页面检索 |
数据要点: Hyper的架构与现有解决方案有本质区别。虽然Glean擅长企业搜索,LlamaIndex提供灵活的RAG框架,但两者都不是为需要实时、关系上下文的自主代理执行而设计的。Hyper的时间知识图谱是一项真正的创新,它直面「陈旧上下文」问题。
关键人物与案例研究
Hyper由Shalin Shah和Kanyes Thaker共同创立,两人分别曾是Databricks和Uber的工程师。他们在这些公司构建大规模数据管道和内部工具的经验直接影响了Hyper的设计。Shalin曾公开表示:「瓶颈不在于模型的智商,而在于模型缺乏机构记忆。」这一理念贯穿产品的每一层。
该平台目前处于私有测试阶段,拥有50家企业客户,包括一家中型金融科技公司、一家医疗健康SaaS提供商和一家游戏工作室。一个值得注意的案例研究涉及一家拥有200名员工的B2B SaaS公司的客户支持自动化部署。在使用Hyper之前,他们基于GPT-4构建的AI支持代理的升级率为35%,因为它无法理解内部产品名称、定价层级或Slack中讨论的最新Bug修复。集成Hyper的「公司大脑」后,升级率降至12%,平均解决时间下降了60%。代理现在能够引用工程团队关于已知问题的Slack线程,并主动提供变通方案。
Hyper的主要竞争格局包括:
- Glean:专注于企业搜索,而非代理执行。Glean能找到正确的文档,但无法基于该文档自主执行多步工作流。
- Cognition (Devin):一个使用自身上下文的AI软件工程师。Devin的定位是……