认识你自己:开源记忆架构让AI拥有持久身份

Hacker News May 2026
来源:Hacker News归档:May 2026
全新开源项目Know Thyself引入结构化记忆模式,让大语言模型能够持久存储用户身份、偏好与交互历史。这标志着AI正从无状态聊天迈向能够“认识自己”、构建连贯长期关系的智能体。

健忘的AI助手时代或许即将终结。AINews独立审查了Know Thyself——一个从根本上重新思考大语言模型如何处理记忆的开源项目。该项目不再依赖每次新会话都会重置的上下文窗口,而是引入了一个结构化的持久记忆层。它定义了用于存储用户身份、偏好、过往决策和情绪状态的正式模式,使LLM能够在数周或数月的交互中保持一致的自我概念。这并非简单的缓存机制,而是一种模仿人类自传体记忆的架构变革。该项目提供了一个轻量级、模型无关的框架,可与任何主流LLM集成,从GPT-4o到Llama 3等开放权重模型均可适用。

技术深度解析

Know Thyself的核心创新在于其结构化个人记忆模式(SPMS)。与仅存储原始嵌入向量的纯向量数据库方法不同,SPMS定义了一个带类型的分层数据模型。该模式包含以下字段:

- 用户身份:唯一ID、人口统计属性,以及追踪信任与熟悉度的“关系评分”。
- 交互历史:带时间戳的条目,包含对话主题、用户情绪以及模型自身的回应策略。
- 偏好向量:用户喜好/厌恶的加权列表(例如:“偏好简洁回答:0.8”、“享受技术深度:0.9”)。
- 情景记忆:来自过往对话的关键事件,以结构化叙事形式存储,并附带因果关联。
- 自我概念:模型赋予自身的一组动态属性(例如:“角色:乐于助人的助手”、“语气:温暖专业”)。

在架构上,该系统位于用户提示与LLM之间。每次查询时,记忆检索模块通过混合方法查询SQLite数据库以获取相关记忆:使用小型嵌入模型(如`all-MiniLM-L6-v2`)进行密集检索以实现语义相似性匹配,同时结合基于关键词的过滤器进行精确匹配。检索到的记忆被格式化为结构化前言,注入到系统提示中。LLM生成响应后,记忆更新模块解析新的交互,提取用户偏好或身份的变化,并更新数据库。冲突解决引擎处理矛盾情况——例如,如果用户说“我讨厌简短回复”,而此前偏好简短回复,系统会标记冲突,要么请求澄清,要么对较旧的记忆应用衰减函数。

该项目的GitHub仓库(目前获得8200颗星)提供了一个干净的Python实现,依赖项极少。开发者发布了一项性能基准测试,将Know Thyself与两个基线方案进行了对比:无记忆的标准GPT-4o,以及使用ChromaDB的朴素向量存储记忆方法。

| 记忆系统 | 5轮一致性 | 20轮一致性 | 用户偏好召回 | 延迟开销 |
|---|---|---|---|---|
| 无记忆 | 62% | 18% | 12% | 0ms |
| ChromaDB(朴素) | 78% | 55% | 68% | +320ms |
| Know Thyself | 94% | 89% | 91% | +180ms |

数据要点: Know Thyself在长期一致性方面(20轮时89%对比55%)显著优于朴素记忆方法,同时增加的延迟低于纯向量存储。这表明其结构化模式减少了检索噪声和更新开销。

该项目还引入了记忆衰减机制——一种逐步降低旧记忆影响力的机制,除非这些记忆被强化。这防止了模型固守过时的用户偏好,并模拟了人类的遗忘过程。衰减率是可配置的,允许开发者针对不同用例进行调优,例如长期陪伴场景(慢速衰减)与任务导向型助手(较快衰减)。

关键参与者与案例研究

Know Thyself由前Google Brain成员Anya Sharma博士领导的一支独立研究团队创建,并以MIT许可证发布。该项目已吸引了来自Hugging Face和LangChain工程师的贡献。虽然尚无大公司正式采用,但已有几家初创公司正在试验:

- Memora AI:一家Y Combinator支持的AI情感陪伴应用,使用Know Thyself来记住用户的生活事件。早期用户测试显示,相比之前的无状态模型,日活跃使用量提升了3倍。
- TaskForge:一个项目管理智能体,使用Know Thyself来追踪团队成员偏好和过往决策。其内部报告称,沟通错误减少了25%。
- OpenInterpreter:一个开源编程助手,已集成Know Thyself以跨会话记住用户的编码风格偏好。

竞争方案包括:

| 产品/项目 | 方法 | 持久性 | 模式 | 开源 | 关键局限 |
|---|---|---|---|---|---|
| Know Thyself | 结构化模式 + 混合检索 | 长期(SQLite) | 是 | 是 | 需要预先设计模式 |
| MemGPT (Letta) | 虚拟上下文管理 | 长期(向量数据库) | 否 | 是 | 计算开销高 |
| ChatGPT Memory | 专有,不透明 | 长期 | 部分 | 否 | 无法定制,供应商锁定 |
| LangChain Memory | 模块化,多后端 | 可配置 | 否 | 是 | 无统一模式,集成复杂 |

数据要点: Know Thyself的关键差异化优势在于其显式、人类可读的模式,这使得对记忆内容及记忆方式可以进行细粒度控制。这与MemGPT的黑盒上下文压缩以及ChatGPT的专有系统形成鲜明对比。

Sharma博士在一篇技术博客文章中表示,其灵感来自关于自传体记忆的认知科学研究。“当前的LLM将每次对话视为全新开始,”她写道,“通过给它们一种结构化的方式来存储

更多来自 Hacker News

AI教AI:递归式智能体课程开启教育新纪元《智能体系统》课程以开源项目形式发布,是一场关于AI成熟度的自我验证实验。一个基于大型语言模型(LLM)、集成代码执行与记忆功能的AI编码智能体,独立完成了课程设计、代码生成与实时问答。这种递归式教学循环意味着,课程能够根据学生反馈调整讲解Anthropic的安全圣战:AI出口管制背后的 Trojan Horse?多年来,Anthropic一直将自己定位为AI行业的道德良知,不断警告存在性风险并要求严苛监管。然而,随着美国政府收紧对先进AI硬件和模型权重的出口管制,越来越多的批评者指出,Anthropic幕后的游说活动是关键的推动力量。AINews通Agent-trace:为AI生成代码颁发可验证的“出生证明”AI编程助手的崛起极大地加速了软件开发,但也引入了一个关键盲区:生成过程仍是一个黑箱。开发者无法审计AI如何得出某段特定代码,导致难以对漏洞、安全缺陷或许可违规追责。Agent-trace 直接填补了这一空白,它定义了一套标准化格式,捕捉A查看来源专题页Hacker News 已收录 5008 篇文章

时间归档

May 20263028 篇已发布文章

延伸阅读

Local-Memory-MCP:开源工具为AI赋予持久化、私有的本地记忆一款名为local-memory-mcp的开源工具,将持久化的RAG记忆系统直接嵌入本地MCP环境,让大语言模型无需依赖云端即可读写长期知识。这解决了家庭用户最头疼的“会话失忆”问题,标志着向真正个性化、用户可控的AI助手迈出了务实的一步。Jeeves TUI:解决AI智能体“记忆失忆”的“时光机”一款名为Jeeves的新型终端工具,正悄然解决AI智能体开发中最令人头疼的难题:无法回忆过往对话。通过将智能体会话视为可搜索、可恢复的对象,Jeeves为开发者提供了他们称之为AI工作流的“时光机”,实现了此前难以企及的连续性与迭代能力。AI教AI:递归式智能体课程开启教育新纪元一门名为《智能体系统》的全新开源课程,以激进的前提问世:整个课程的设计、编码与授课均由AI编码智能体独立完成。这种递归式的“AI教AI”方法,不仅传授构建自主系统的知识,更是一场智能体技术真实能力的现场演示,标志着从静态内容到动态、自适应教Anthropic的安全圣战:AI出口管制背后的 Trojan Horse?自诩为“负责任AI”旗手的Anthropic,正因其推动严格安全监管的游说行为而面临审视。最新分析表明,其倡导可能是一场精心策划的战略,旨在影响美国对AI芯片和模型权重的出口管制,从而为自身筑起一道针对全球竞争对手和开源社区的监管护城河。

常见问题

GitHub 热点“Know Thyself: Open-Source Memory Architecture Lets AI Build Persistent Identity”主要讲了什么?

The era of the forgetful AI assistant may be ending. AINews has independently examined Know Thyself, an open-source project that fundamentally rethinks how large language models ha…

这个 GitHub 项目在“how to install Know Thyself LLM memory”上为什么会引发关注?

Know Thyself's core innovation is its Structured Personal Memory Schema (SPMS). Unlike vector-database-only approaches that store raw embeddings, SPMS defines a typed, hierarchical data model. The schema includes fields…

从“Know Thyself vs MemGPT memory comparison”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。