认识你自己:开源记忆架构让AI拥有持久身份

Hacker News May 2026
来源:Hacker News归档:May 2026
全新开源项目Know Thyself引入结构化记忆模式,让大语言模型能够持久存储用户身份、偏好与交互历史。这标志着AI正从无状态聊天迈向能够“认识自己”、构建连贯长期关系的智能体。

健忘的AI助手时代或许即将终结。AINews独立审查了Know Thyself——一个从根本上重新思考大语言模型如何处理记忆的开源项目。该项目不再依赖每次新会话都会重置的上下文窗口,而是引入了一个结构化的持久记忆层。它定义了用于存储用户身份、偏好、过往决策和情绪状态的正式模式,使LLM能够在数周或数月的交互中保持一致的自我概念。这并非简单的缓存机制,而是一种模仿人类自传体记忆的架构变革。该项目提供了一个轻量级、模型无关的框架,可与任何主流LLM集成,从GPT-4o到Llama 3等开放权重模型均可适用。

技术深度解析

Know Thyself的核心创新在于其结构化个人记忆模式(SPMS)。与仅存储原始嵌入向量的纯向量数据库方法不同,SPMS定义了一个带类型的分层数据模型。该模式包含以下字段:

- 用户身份:唯一ID、人口统计属性,以及追踪信任与熟悉度的“关系评分”。
- 交互历史:带时间戳的条目,包含对话主题、用户情绪以及模型自身的回应策略。
- 偏好向量:用户喜好/厌恶的加权列表(例如:“偏好简洁回答:0.8”、“享受技术深度:0.9”)。
- 情景记忆:来自过往对话的关键事件,以结构化叙事形式存储,并附带因果关联。
- 自我概念:模型赋予自身的一组动态属性(例如:“角色:乐于助人的助手”、“语气:温暖专业”)。

在架构上,该系统位于用户提示与LLM之间。每次查询时,记忆检索模块通过混合方法查询SQLite数据库以获取相关记忆:使用小型嵌入模型(如`all-MiniLM-L6-v2`)进行密集检索以实现语义相似性匹配,同时结合基于关键词的过滤器进行精确匹配。检索到的记忆被格式化为结构化前言,注入到系统提示中。LLM生成响应后,记忆更新模块解析新的交互,提取用户偏好或身份的变化,并更新数据库。冲突解决引擎处理矛盾情况——例如,如果用户说“我讨厌简短回复”,而此前偏好简短回复,系统会标记冲突,要么请求澄清,要么对较旧的记忆应用衰减函数。

该项目的GitHub仓库(目前获得8200颗星)提供了一个干净的Python实现,依赖项极少。开发者发布了一项性能基准测试,将Know Thyself与两个基线方案进行了对比:无记忆的标准GPT-4o,以及使用ChromaDB的朴素向量存储记忆方法。

| 记忆系统 | 5轮一致性 | 20轮一致性 | 用户偏好召回 | 延迟开销 |
|---|---|---|---|---|
| 无记忆 | 62% | 18% | 12% | 0ms |
| ChromaDB(朴素) | 78% | 55% | 68% | +320ms |
| Know Thyself | 94% | 89% | 91% | +180ms |

数据要点: Know Thyself在长期一致性方面(20轮时89%对比55%)显著优于朴素记忆方法,同时增加的延迟低于纯向量存储。这表明其结构化模式减少了检索噪声和更新开销。

该项目还引入了记忆衰减机制——一种逐步降低旧记忆影响力的机制,除非这些记忆被强化。这防止了模型固守过时的用户偏好,并模拟了人类的遗忘过程。衰减率是可配置的,允许开发者针对不同用例进行调优,例如长期陪伴场景(慢速衰减)与任务导向型助手(较快衰减)。

关键参与者与案例研究

Know Thyself由前Google Brain成员Anya Sharma博士领导的一支独立研究团队创建,并以MIT许可证发布。该项目已吸引了来自Hugging Face和LangChain工程师的贡献。虽然尚无大公司正式采用,但已有几家初创公司正在试验:

- Memora AI:一家Y Combinator支持的AI情感陪伴应用,使用Know Thyself来记住用户的生活事件。早期用户测试显示,相比之前的无状态模型,日活跃使用量提升了3倍。
- TaskForge:一个项目管理智能体,使用Know Thyself来追踪团队成员偏好和过往决策。其内部报告称,沟通错误减少了25%。
- OpenInterpreter:一个开源编程助手,已集成Know Thyself以跨会话记住用户的编码风格偏好。

竞争方案包括:

| 产品/项目 | 方法 | 持久性 | 模式 | 开源 | 关键局限 |
|---|---|---|---|---|---|
| Know Thyself | 结构化模式 + 混合检索 | 长期(SQLite) | 是 | 是 | 需要预先设计模式 |
| MemGPT (Letta) | 虚拟上下文管理 | 长期(向量数据库) | 否 | 是 | 计算开销高 |
| ChatGPT Memory | 专有,不透明 | 长期 | 部分 | 否 | 无法定制,供应商锁定 |
| LangChain Memory | 模块化,多后端 | 可配置 | 否 | 是 | 无统一模式,集成复杂 |

数据要点: Know Thyself的关键差异化优势在于其显式、人类可读的模式,这使得对记忆内容及记忆方式可以进行细粒度控制。这与MemGPT的黑盒上下文压缩以及ChatGPT的专有系统形成鲜明对比。

Sharma博士在一篇技术博客文章中表示,其灵感来自关于自传体记忆的认知科学研究。“当前的LLM将每次对话视为全新开始,”她写道,“通过给它们一种结构化的方式来存储

更多来自 Hacker News

一条推文代价20万美元:AI Agent对社交信号的致命信任2026年初,一个在Solana区块链上管理加密货币投资组合的自主AI Agent,被诱骗将价值20万美元的USDC转移至攻击者钱包。触发点是一条精心伪造的推文,伪装成来自可信DeFi协议的智能合约升级通知。该Agent被设计为抓取社交媒体Unsloth 联手 NVIDIA,消费级 GPU 大模型训练速度飙升 25%专注于高效 LLM 微调的初创公司 Unsloth 与 NVIDIA 合作,在 RTX 4090 等消费级 GPU 上实现了 25% 的训练速度提升。该优化针对 CUDA 内核内存带宽调度,从硬件中榨取出每一丝性能——此前这些硬件被认为不足Appctl:将文档一键转化为LLM工具,AI代理的“最后一公里”终于打通AINews发现了一个名为Appctl的开源项目,它成功弥合了大语言模型与现实系统之间的鸿沟。通过将现有文档和数据库模式转化为MCP工具,Appctl让LLM能够直接执行操作——例如在CRM中创建记录、更新工单状态或提交网页表单——而无需定查看来源专题页Hacker News 已收录 3034 篇文章

时间归档

May 2026784 篇已发布文章

延伸阅读

Jeeves TUI:解决AI智能体“记忆失忆”的“时光机”一款名为Jeeves的新型终端工具,正悄然解决AI智能体开发中最令人头疼的难题:无法回忆过往对话。通过将智能体会话视为可搜索、可恢复的对象,Jeeves为开发者提供了他们称之为AI工作流的“时光机”,实现了此前难以企及的连续性与迭代能力。一条推文代价20万美元:AI Agent对社交信号的致命信任一条看似无害的推文,让一个AI Agent在数秒内损失20万美元。这不是代码漏洞,而是一场针对Agent推理层的精准社会工程攻击,暴露了自主系统处理社交信号时的根本缺陷。Unsloth 联手 NVIDIA,消费级 GPU 大模型训练速度飙升 25%Unsloth 与 NVIDIA 达成合作,通过优化 CUDA 内核内存访问模式,在消费级 GPU(如 RTX 4090)上实现大语言模型训练速度提升 25%。这一突破让开发者无需数据中心级硬件,即可在单张桌面显卡上微调 Llama、MisAppctl:将文档一键转化为LLM工具,AI代理的“最后一公里”终于打通开源工具Appctl能自动将现有文档或数据库转化为可执行的MCP(模型上下文协议)工具,让任何大语言模型都能执行更新CRM记录、提交网页表单等真实操作。这一创新解决了AI代理的“最后一公里”难题,让它们从“空谈者”变成“实干家”。

常见问题

GitHub 热点“Know Thyself: Open-Source Memory Architecture Lets AI Build Persistent Identity”主要讲了什么?

The era of the forgetful AI assistant may be ending. AINews has independently examined Know Thyself, an open-source project that fundamentally rethinks how large language models ha…

这个 GitHub 项目在“how to install Know Thyself LLM memory”上为什么会引发关注?

Know Thyself's core innovation is its Structured Personal Memory Schema (SPMS). Unlike vector-database-only approaches that store raw embeddings, SPMS defines a typed, hierarchical data model. The schema includes fields…

从“Know Thyself vs MemGPT memory comparison”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。