Cortex:Markdown 如何成为AI代理的原生记忆操作系统

Hacker News June 2026
来源:Hacker NewsAI agentMCP protocol归档:June 2026
Cortex是一个开源项目,它将Markdown文件转化为AI代理的原生知识操作系统。受Karpathy的LLM Wiki启发,并基于MCP协议构建,它使代理能够读取、写入、链接和推理纯文本知识文件,无需向量数据库,预示着代理记忆架构的范式转变。

AINews独立调查了Cortex,这是一个新兴的开源框架,它重新构想了AI代理如何存储、检索和推理知识。与依赖不透明的向量嵌入和外部数据库不同,Cortex将Markdown文件视为代理记忆的基本单元——每个笔记、链接和标签都成为语义图中的一个节点,可通过模型上下文协议(MCP)进行遍历。该项目直接受Andrej Karpathy的LLM Wiki概念启发,该概念倡导最小化、基于文件的知识结构,这些结构能随代理的经验自然扩展。Cortex更进一步,增加了确定性检索、版本化状态管理和主动上下文注入——这意味着代理不仅被动存储信息,还主动构建和维护一个持续进化的知识图谱。

技术深度解析

Cortex的架构看似简单,但概念上却意义深远。其核心是用一个完全基于Markdown的基于文件的语义图取代了传统的向量数据库+嵌入模型栈。该系统分为三个层次运行:

1. 存储层:一个Markdown文件目录,每个文件代表一个知识单元。文件可以包含用于元数据的YAML前置元数据、用于交叉引用的维基链接(`[[...]]`)以及用于分类的标签(`#tag`)。文件系统本身就成了数据库——无需PostgreSQL、无需Pinecone、无需Redis。

2. 索引层:启动时,Cortex解析所有Markdown文件,并在内存中构建一个图,其中每个文件是一个节点,每个维基链接是一条边,每个标签是一个属性。这个图可以通过MCP(模型上下文协议)进行遍历,MCP为LLM查询知识库提供了标准化接口。与返回概率匹配的向量搜索不同,Cortex基于精确的链接遍历和标签过滤返回确定性结果。

3. 推理层:当代理需要上下文时,它会向Cortex发送一个MCP请求。系统通过遍历图来解析请求——例如,从根笔记沿着维基链接链追踪到相关概念,然后将相关的Markdown内容作为纯文本返回。LLM将这段上下文作为其提示的一部分接收,使其能够在无需任何嵌入步骤的情况下对知识进行推理。

MCP协议在此至关重要。由Anthropic开发并于2024年底开源,MCP定义了AI模型如何与外部工具和数据源交互。Cortex实现了一个MCP服务器,暴露了诸如`read_file`、`search_links`、`list_tags`和`get_context`等端点。这意味着任何兼容MCP的代理——无论是基于Claude、GPT还是开源模型——都可以无需自定义集成代码就能接入Cortex。

性能特征与基于向量的系统截然不同。下表将Cortex与使用OpenAI嵌入+Pinecone的典型RAG流水线进行了比较:

| 指标 | Cortex (Markdown图) | 传统RAG (嵌入 + 向量数据库) |
|---|---|---|
| 检索延迟 (p50) | ~15ms (文件I/O + 图遍历) | ~120ms (嵌入 + ANN搜索 + 重排序) |
| 存储开销 | 约为原始文本大小的1.2倍 | 约为原始文本大小的10倍 (嵌入 + 索引) |
| 确定性 | 100% (精确匹配) | 概率性 (召回率约85-95%) |
| 人类可读性 | 完全可读 (Markdown是纯文本) | 不可读 (嵌入是不透明的) |
| 冷启动时间 | <100ms (解析文件) | 5-30分钟 (构建索引) |
| 最大知识量 | ~1000万token (受文件系统限制) | 几乎无限 (随数据库扩展) |

数据要点: Cortex在延迟、确定性和简单性方面胜出,但在规模上有所不足。对于约1000万token(大约20,000页文本)以下的知识库,Cortex更快、更可靠。超出这个范围,向量数据库仍然占主导地位。权衡很明确:Cortex针对质量和可解释性进行了优化,而非蛮力扩展。

相关开源仓库:核心Cortex项目在GitHub上(cortex-ai/cortex),截至2026年6月拥有约4,200颗星。MCP规范在modelcontextprotocol/spec(12,000+颗星)。对于那些想要尝试的人,官方的Cortex快速入门使用了一个`notes/`目录,其中包含演示维基链接和标签的示例Markdown文件。

关键参与方与案例研究

Cortex处于几个运动的交汇点:Andrej Karpathy倡导的LLM Wiki哲学、Anthropic的MCP协议,以及来自LangChain和AutoGPT等公司向代理原生架构的更广泛推动。

Andrej Karpathy的影响不容低估。在他2024年的博文“LLM Wiki”中,Karpathy认为LLM的理想知识存储是一个纯文本文件集合——而不是一个数据库。他演示了一个原型,其中模型可以读取和写入一个Markdown文件文件夹,有效地将文件系统用作记忆。Cortex本质上是对这一愿景的生产级实现,增加了MCP集成、版本控制和多代理协作。

Anthropic的MCP团队发挥了重要作用。虽然MCP是为通用工具使用而设计的,但Cortex是首批专门将其用于知识管理的项目之一。Anthropic并未正式认可Cortex,但几位Anthropic工程师根据Cortex团队的反馈为MCP规范做出了贡献。

竞争方法包括:

| 解决方案 | 方法 | 主要限制 | GitHub星数 |
|---|---|---|---|
| Cortex | Markdown图 + MCP | 规模上限约1000万token | 4,200 |
| LangChain (记忆) | 向量存储 + SQLite | 复杂流水线,不透明嵌入 | 95,000 |
| Mem0 | 混合向量 + 图 | 专有,不够透明 | 8,500 |
| Zettelkasten (Obsidian) | 手动图,无MCP | 非代理原生,无协议 | 60,000 (Obsidian) |

数据要点: Cortex是按星数计算最小的项目,但最专注。其利基市场是明确的:为需要确定性、可解释性和低延迟的代理提供轻量级、可审计的知识管理。它并非旨在取代大规模RAG系统,而是为代理记忆提供一个更简洁、更可靠的替代方案。

更多来自 Hacker News

中国封堵西方AI模型,硅谷却拥抱DeepSeek开源力量中华人民共和国已升级对西方AI模型的监管姿态,规定任何在其境内运营的外国大语言模型必须将所有用户数据存储于国内服务器,并通过国家管理的内容安全审查。此举实际上将OpenAI、Anthropic和谷歌等公司在中国市场的合规成本提升至近乎禁止的甲骨文千亿债务炸弹:AI热潮背后的财务悬崖甲骨文向AI基础设施的转型,堪称一场财务高空走钢丝。该公司激进举债——长期债务现已突破1000亿美元——用于采购数万块NVIDIA H100和H200 GPU,建设数据中心以与亚马逊云服务(AWS)、微软Azure和谷歌云竞争。这一策略最初SentinelMCP:守护AI代理工具调用的开源防火墙AI代理的爆发式增长,离不开其与外部工具的深度融合,而模型上下文协议(MCP)正迅速成为连接这些工具的标准化桥梁。然而,当业界将大量精力聚焦于模型本身的安全性——如对齐、越狱攻击和提示注入时,代理与工具之间的通信通道却始终是一片无人设防的巨查看来源专题页Hacker News 已收录 4606 篇文章

相关专题

AI agent199 篇相关文章MCP protocol31 篇相关文章

时间归档

June 20261209 篇已发布文章

延伸阅读

Publora单一API打通十大社交网络,AI代理内容分发迎来统一入口Publora正崛起为AI代理的关键基础设施层,其单一API即可连接十大主流社交网络。通过集成模型上下文协议(MCP),它让大语言模型能够动态发现并执行发布任务,标志着全自动、多平台内容分发时代的到来。缓存革命:AI智能体如何将长对话成本削减90%一种新颖的分层提示缓存技术,正在打破AI智能体在推理质量与成本之间长期存在的权衡。通过智能复用静态上下文并仅计算增量更新,该方法将令牌消耗降低70-90%,同时保持——甚至在某些情况下提升——智能体在数百轮对话中的连贯性。Web Speed开源:轻量级站点地图,或成AI时代的HTTP新协议开源工具Web Speed将HTML解析为轻量级站点地图,AI代理可直接读取,无需处理完整HTML或截图。原生支持MCP协议,让任何兼容AI都能控制浏览器,为自主网络代理带来基础设施级的效率革命。Nyx Wave:用邮件对话挖掘专家知识的AI智能体Nyx Wave是一款通过自然邮件对话提取专家知识的AI智能体,彻底告别结构化数据库或面对面访谈的繁琐。它将最普及的专业工具——电子邮件——转化为知识捕获界面,有望让行业专家经验的保存变得人人可及。

常见问题

GitHub 热点“Cortex: How Markdown Is Becoming the Native Operating System for AI Agent Memory”主要讲了什么?

AINews has independently investigated Cortex, an emerging open-source framework that reimagines how AI agents store, retrieve, and reason over knowledge. Instead of relying on opaq…

这个 GitHub 项目在“Cortex vs vector database for AI agent memory”上为什么会引发关注?

Cortex's architecture is deceptively simple but conceptually profound. At its core, it replaces the traditional vector database + embedding model stack with a file-based semantic graph built entirely on Markdown. The sys…

从“How to set up Cortex with Claude MCP”看,这个 GitHub 项目的热度表现如何?

当前相关 GitHub 项目总星标约为 0,近一日增长约为 0,这说明它在开源社区具有较强讨论度和扩散能力。