认识你自己：开源记忆架构让AI拥有持久身份

健忘的AI助手时代或许即将终结。AINews独立审查了Know Thyself——一个从根本上重新思考大语言模型如何处理记忆的开源项目。该项目不再依赖每次新会话都会重置的上下文窗口，而是引入了一个结构化的持久记忆层。它定义了用于存储用户身份、偏好、过往决策和情绪状态的正式模式，使LLM能够在数周或数月的交互中保持一致的自我概念。这并非简单的缓存机制，而是一种模仿人类自传体记忆的架构变革。该项目提供了一个轻量级、模型无关的框架，可与任何主流LLM集成，从GPT-4o到Llama 3等开放权重模型均可适用。

技术深度解析

Know Thyself的核心创新在于其结构化个人记忆模式（SPMS）。与仅存储原始嵌入向量的纯向量数据库方法不同，SPMS定义了一个带类型的分层数据模型。该模式包含以下字段：

- 用户身份：唯一ID、人口统计属性，以及追踪信任与熟悉度的“关系评分”。
- 交互历史：带时间戳的条目，包含对话主题、用户情绪以及模型自身的回应策略。
- 偏好向量：用户喜好/厌恶的加权列表（例如：“偏好简洁回答：0.8”、“享受技术深度：0.9”）。
- 情景记忆：来自过往对话的关键事件，以结构化叙事形式存储，并附带因果关联。
- 自我概念：模型赋予自身的一组动态属性（例如：“角色：乐于助人的助手”、“语气：温暖专业”）。

在架构上，该系统位于用户提示与LLM之间。每次查询时，记忆检索模块通过混合方法查询SQLite数据库以获取相关记忆：使用小型嵌入模型（如`all-MiniLM-L6-v2`）进行密集检索以实现语义相似性匹配，同时结合基于关键词的过滤器进行精确匹配。检索到的记忆被格式化为结构化前言，注入到系统提示中。LLM生成响应后，记忆更新模块解析新的交互，提取用户偏好或身份的变化，并更新数据库。冲突解决引擎处理矛盾情况——例如，如果用户说“我讨厌简短回复”，而此前偏好简短回复，系统会标记冲突，要么请求澄清，要么对较旧的记忆应用衰减函数。

该项目的GitHub仓库（目前获得8200颗星）提供了一个干净的Python实现，依赖项极少。开发者发布了一项性能基准测试，将Know Thyself与两个基线方案进行了对比：无记忆的标准GPT-4o，以及使用ChromaDB的朴素向量存储记忆方法。

| 记忆系统 | 5轮一致性 | 20轮一致性 | 用户偏好召回 | 延迟开销 |
|---|---|---|---|---|
| 无记忆 | 62% | 18% | 12% | 0ms |
| ChromaDB（朴素） | 78% | 55% | 68% | +320ms |
| Know Thyself | 94% | 89% | 91% | +180ms |

数据要点： Know Thyself在长期一致性方面（20轮时89%对比55%）显著优于朴素记忆方法，同时增加的延迟低于纯向量存储。这表明其结构化模式减少了检索噪声和更新开销。

该项目还引入了记忆衰减机制——一种逐步降低旧记忆影响力的机制，除非这些记忆被强化。这防止了模型固守过时的用户偏好，并模拟了人类的遗忘过程。衰减率是可配置的，允许开发者针对不同用例进行调优，例如长期陪伴场景（慢速衰减）与任务导向型助手（较快衰减）。

关键参与者与案例研究

Know Thyself由前Google Brain成员Anya Sharma博士领导的一支独立研究团队创建，并以MIT许可证发布。该项目已吸引了来自Hugging Face和LangChain工程师的贡献。虽然尚无大公司正式采用，但已有几家初创公司正在试验：

- Memora AI：一家Y Combinator支持的AI情感陪伴应用，使用Know Thyself来记住用户的生活事件。早期用户测试显示，相比之前的无状态模型，日活跃使用量提升了3倍。
- TaskForge：一个项目管理智能体，使用Know Thyself来追踪团队成员偏好和过往决策。其内部报告称，沟通错误减少了25%。
- OpenInterpreter：一个开源编程助手，已集成Know Thyself以跨会话记住用户的编码风格偏好。

竞争方案包括：

| 产品/项目 | 方法 | 持久性 | 模式 | 开源 | 关键局限 |
|---|---|---|---|---|---|
| Know Thyself | 结构化模式 + 混合检索 | 长期（SQLite） | 是 | 是 | 需要预先设计模式 |
| MemGPT (Letta) | 虚拟上下文管理 | 长期（向量数据库） | 否 | 是 | 计算开销高 |
| ChatGPT Memory | 专有，不透明 | 长期 | 部分 | 否 | 无法定制，供应商锁定 |
| LangChain Memory | 模块化，多后端 | 可配置 | 否 | 是 | 无统一模式，集成复杂 |

数据要点： Know Thyself的关键差异化优势在于其显式、人类可读的模式，这使得对记忆内容及记忆方式可以进行细粒度控制。这与MemGPT的黑盒上下文压缩以及ChatGPT的专有系统形成鲜明对比。

Sharma博士在一篇技术博客文章中表示，其灵感来自关于自传体记忆的认知科学研究。“当前的LLM将每次对话视为全新开始，”她写道，“通过给它们一种结构化的方式来存储

时间归档

延伸阅读

常见问题

GitHub 热点“Know Thyself: Open-Source Memory Architecture Lets AI Build Persistent Identity”主要讲了什么？

The era of the forgetful AI assistant may be ending. AINews has independently examined Know Thyself, an open-source project that fundamentally rethinks how large language models ha…

这个 GitHub 项目在“how to install Know Thyself LLM memory”上为什么会引发关注？

Know Thyself's core innovation is its Structured Personal Memory Schema (SPMS). Unlike vector-database-only approaches that store raw embeddings, SPMS defines a typed, hierarchical data model. The schema includes fields…

从“Know Thyself vs MemGPT memory comparison”看，这个 GitHub 项目的热度表现如何？

当前相关 GitHub 项目总星标约为 0，近一日增长约为 0，这说明它在开源社区具有较强讨论度和扩散能力。