DIY Linux黑客方案赋予AI永久记忆,挑战每月100美元的订阅服务

Hacker News May 2026
来源:Hacker NewsAI memoryClaude Code归档:May 2026
一位开发者通过将Claude、Claude Code等AI工具路由至单一Linux服务器,构建了一套DIY系统,赋予它们持久记忆。这一黑客方案绕过了SSH速率限制,创建了跨会话工作区,直接挑战了Mem0等基于订阅的记忆服务。

在一项暴露AI“失忆症”深层痛点的大胆举措中,一位开发者设计了一个基于Linux的后门,将Claude、Claude Code及其他AI助手统一整合到一个持久的单一工作区内。通过将所有AI工具流量路由至一台Linux服务器,该方案绕过了Claude Code的SSH速率限制——该限制会在一定请求次数后切断连接——并创建了一个跨会话持久化的共享文件系统、数据库和运行时环境。这意味着AI代理现在能够“记住”昨天的代码、数据和上下文,无需重新解释一切。

这项技术成就看似简单却意义深远:开发者没有依赖Mem0这类云端记忆服务(后者每月收费100美元,本质上只是存储文本片段),而是使用一台支持SSH的Linux主机作为核心。该方案通过修改`~/.ssh/config`文件建立本地端口转发规则,将每个AI工具的API端点映射到服务器上的本地端口,从而拦截并路由所有API调用。每个会话被分配唯一ID,对应服务器上的专属目录,包含文件系统、SQLite数据库和运行时环境(如Docker容器)。代理脚本自动挂载该目录,确保文件操作持久化。

为绕过速率限制,开发者利用`autossh`和`tmux`维持单一持久SSH连接,通过复用同一TCP套接字隐藏实际连接数——这是经典的“连接池”技术。记忆层则通过ChromaDB(开源向量数据库)和本地嵌入模型(如Sentence Transformers的`all-MiniLM-L6-v2`)实现上下文检索与注入。测试显示,DIY系统提供无限制的上下文保留,成本仅为每月5美元(服务器费用),远低于Mem0的100美元,但延迟略高(1.8秒对1.5秒),且安全风险因自管理而升高。

技术深度解析

这套DIY持久记忆系统的核心架构看似简单,却揭示了LLM基础设施设计的深层洞察。其核心是将一台Linux服务器作为通用中继和存储枢纽。具体工作原理如下:

1. 流量拦截与路由:开发者设置一个SSH隧道,将所有来自Claude、Claude Code及其他AI工具的API调用路由至单一Linux服务器。这通过修改`~/.ssh/config`文件实现,创建本地端口转发规则,将每个AI工具的API端点映射到服务器上的本地端口。例如,Claude Code的默认API调用从`api.anthropic.com`重定向至`localhost:8080`,一个轻量级代理脚本(使用Python的`asyncio`编写)将其转发至实际API,同时记录并存储上下文。

2. 持久工作区管理:每个AI会话被分配唯一会话ID,用于在服务器上创建专属目录(例如`/workspaces/session_12345/`)。该目录包含文件系统、SQLite数据库和运行时环境(如Docker容器)。代理脚本自动为AI工具挂载此目录,因此会话期间创建、修改或读取的任何文件都会保存至服务器。当新会话使用相同ID启动时,AI工具会看到完全相同的状态。

3. 绕过SSH速率限制:Claude Code设置了SSH速率限制——通常每个IP每分钟10次请求——以防止滥用。该方案通过将多个AI工具连接复用至单一SSH会话来绕过此限制。利用`autossh`和`tmux`,开发者维持一个持久SSH连接,为所有请求复用同一TCP套接字,从而有效隐藏单个连接的数量,使其不被速率限制器察觉。这是经典“连接池”技术在AI基础设施上的应用。

4. 记忆层实现:记忆层并非独立服务,而是一组在服务器上运行的脚本。关键组件是一个“上下文管理器”,使用向量数据库(ChromaDB,一个开源嵌入数据库)存储和检索对话历史。每次交互通过本地模型(如Sentence Transformers的`all-MiniLM-L6-v2`)进行嵌入,并附带元数据(会话ID、时间戳、工具名称)存储。当新查询到来时,系统检索最相关的5条历史交互,将其作为上下文注入提示中。

性能基准测试:该系统针对标准Claude Code使用和Mem0订阅进行了测试。结果总结如下:

| 指标 | 标准Claude Code | Mem0订阅 | DIY Linux系统 |
|---|---|---|---|
| 跨会话上下文保留 | 无 | 最多10,000个token | 无限制(基于磁盘) |
| 每次查询延迟(平均) | 1.2秒 | 1.5秒(含记忆检索) | 1.8秒(含本地嵌入) |
| 每月成本(单用户) | 20美元(API使用费) | 100美元(订阅费) | 5美元(服务器费用) |
| 设置时间 | 0分钟 | 5分钟 | 30分钟 |
| 安全风险 | 低 | 中(数据在云端) | 高(自管理) |

数据要点:DIY系统以极低成本提供无限制上下文保留,但延迟更高且安全风险更大。延迟增加源于本地嵌入生成,可通过GPU加速优化。

相关开源仓库
- ChromaDB (github.com/chroma-core/chroma):一个可自托管的向量数据库。开发者用它进行记忆检索。该项目拥有超过15,000颗星,且维护活跃。
- autossh (github.com/Autossh/autossh):用于维持持久SSH连接的工具。对绕过速率限制至关重要。
- Sentence Transformers (github.com/UKPLab/sentence-transformers):用于本地生成嵌入。`all-MiniLM-L6-v2`模型是轻量级选项,性能良好。

关键玩家与案例研究

DIY记忆黑客方案直接挑战了AI记忆领域的现有玩家。最突出的是Mem0,一家由Y Combinator支持的初创公司,提供“记忆即服务”API。Mem0的定价从每月100美元起,包含10,000个记忆单元(每个单元大致相当于一句话的上下文)。该公司已筹集350万美元种子资金,并声称平台上有超过5,000名开发者。

另一个关键玩家是LangChain,其框架中提供了“记忆”模块。LangChain的记忆更灵活,但要求开发者自行管理存储(例如Redis、PostgreSQL)。它免费使用,但需要工程投入。

记忆解决方案对比

| 解决方案 | 定价 | 上下文限制 | 设置复杂度 | 数据控制 |
|---|---|---|---|---|
| Mem0 | 100美元/月 | 10,000个单元 | 低(API密钥) | 云端托管 |
| LangChain记忆 | 免费(自托管) | 无限制(基于磁盘) | 中(代码集成) | 完全控制 |
| DIY Linux系统 | 约5美元/月(服务器) | 无限制(基于磁盘) | 高(手动设置) | 完全控制 |

更多来自 Hacker News

ZCode 登场:GLM 团队原生代码助手剑指开发者工具市场打造出强大 ChatGLM 系列大模型的 GLM 团队,现已正式发布专为 AI 编程打造的助手 ZCode。这一举措代表着一次重大的战略转向:该团队不再满足于仅作为基础模型提供商,而是直接杀入开发者工具应用层展开竞争。ZCode 原生构建于Axiom OS:用Rust打造的内核,敢于重新定义AI推理Axiom的开源发布标志着AI基础设施领域的一次激进变革。这个完全用Rust开发的内核,既不是精简版Linux,也不是微内核实验——它是一个专为在裸机上直接执行Transformer工作负载而设计的运行时。其核心洞察在于,现代LLM推理——AI编程模型:更聪明、更便宜,开发者工具革命正在重塑软件生态开发者社区正热议AI编程助手的未来,而趋势已十分明朗:模型正同时变得更聪明、更便宜。这并非渐进式改进,而是一次结构性变革。新的训练范式优先强调推理而非记忆,使得更小、更高效的模型在复杂编程任务上超越其更大的前辈。与此同时,由于量化、投机性解查看来源专题页Hacker News 已收录 5511 篇文章

相关专题

AI memory45 篇相关文章Claude Code246 篇相关文章

时间归档

May 20263028 篇已发布文章

延伸阅读

Claude Code变身Kubernetes SRE:AI Agent自主修复VictoriaMetrics生产故障Anthropic的编程代理Claude Code被部署为VictoriaMetrics的Kubernetes调试代理,自主分析集群日志与配置错误并提出修复方案。这一实验标志着AI从代码生成器跃升为生产基础设施管理的积极参与者。递归研究技能:让AI编程代理从代码生成器进化为自学习协作者一项突破性的开源项目,为Claude Code、OpenClaw和Codex等AI编程代理注入了递归研究能力——使它们能够在闭环学习循环中自主搜索、阅读和综合信息。这标志着从被动代码生成到主动知识获取的范式转变,将AI转变为真正的协作者。13岁少年用AI三周做出游戏:学习曲线已被抹平,谁在重新定义“开发者”一名仅掌握基础Python和JavaScript知识的13岁少年,借助Claude Code与Godot MCP,在短短三周内独立完成了复古游戏《The Sword of Ghix》第一章。这一案例表明,AI正在大幅压缩从创意到可交付产品的AI编程助手从技术主管沦为菜鸟:信任危机爆发越来越多开发者报告称,顶级AI编程助手的质量突然严重下滑——Codex with GPT 5.5 Extra High和Claude Code on Opus 4.6-4.7等模型,从深思熟虑的技术主管变成了过度自信、无视指令的新手。这种“

常见问题

这次模型发布“DIY Linux Hack Gives AI Permanent Memory, Challenging $100/Month Subscription Services”的核心内容是什么?

In a move that exposes the deep frustration with AI's 'amnesia,' a developer has engineered a Linux-based backdoor that unifies Claude, Claude Code, and other AI assistants into a…

从“How to set up a persistent AI workspace with Linux”看,这个模型发布为什么重要?

The core architecture of this DIY persistent memory system is deceptively simple but reveals deep insights into LLM infrastructure design. At its heart, the system uses a Linux server as a universal relay and storage hub…

围绕“Cheapest alternative to Mem0 for AI memory”,这次模型更新对开发者和企业有什么影响?

开发者通常会重点关注能力提升、API 兼容性、成本变化和新场景机会,企业则会更关心可替代性、接入门槛和商业化落地空间。