Celesto 推出 PB 级沙盒持久内存:AI 智能体终于拥有永久记忆

Hacker News July 2026
来源:Hacker NewsAI agents归档:July 2026
Celesto 为其 AI 智能体沙盒环境激活了 PB 级持久存储,这一突破让编码智能体、测试框架以及大文件处理工作流彻底摆脱临时内存限制。持久存储意味着智能体能够保留长期上下文、管理海量代码库,并在多次交互中保持状态一致性,直击 AI 智能体长期以来的核心痛点。

AI 行业长期以来将智能体内存视为一种可丢弃的资源——临时性、会话绑定,一旦上下文窗口溢出便容易发生灾难性遗忘。Celesto 为其 AI 智能体沙盒配备 PB 级持久存储的决定,从根本上改写了这一假设。通过将存储从临时缓存升级为永久记忆,该平台允许智能体跨会话操作、回溯过往决策,并处理此前在单次交互中不可能完成的数据集。这不仅是容量升级,更是智能体自主性的质变。对于构建需要驾驭百万行代码仓库的编码智能体、生成 GB 级日志的测试框架,或需要处理海量中间文件的视频生成管线的开发者而言,这一变化意味着智能体终于能够像人类开发者一样拥有“长期记忆”,而不再每次从头开始。

技术深度解析

Celesto 的持久存储层构建在分布式对象存储架构之上,该架构抽象了管理 PB 级数据的复杂性,同时为智能体工作流提供低延迟访问。其核心采用分片键值存储,并支持可配置的复制因子,使得智能体在读取和写入 1 GB 以内的对象时延迟低于 10 毫秒,对于更大的数据块则能实现线性吞吐扩展。该存储层通过虚拟文件系统接口直接集成到 Celesto 的沙盒运行时中,这意味着智能体可以使用标准的文件 I/O 操作(打开、读取、写入、定位)与持久数据交互,而无需修改任何代码。这是一个深思熟虑的设计选择:Celesto 没有强迫开发者采用新的 API,而是让持久内存感觉像本地驱动器一样,从而降低了智能体开发者的认知负担。

真正的创新在于上下文感知的缓存层。Celesto 采用多层缓存架构:将频繁访问的数据存放在 RAM(热层),近期访问的数据存放在 NVMe SSD(温层),冷数据则存放在基于 HDD 的对象存储中。该缓存并非静态不变,它通过一个轻量级预测模型学习智能体的访问模式,并预取后续步骤可能需要的的数据。早期基准测试显示,对于在大型代码库上迭代的编码智能体工作负载,与朴素的 LRU 缓存相比,该机制将平均读取延迟降低了 73%。存储层还支持原子多对象事务,使智能体能够将复杂的状态更新——例如修改多个配置文件、更新数据库 schema 并记录变更——作为一个原子操作执行。如果智能体在操作中途崩溃,整个事务将回滚,从而防止部分状态损坏。

对于有兴趣探索类似方法的开发者,开源项目 InfinityFS(GitHub: infinityfs/infinityfs,4.2k 星)提供了一个用户空间文件系统,可将云对象存储暴露为 POSIX 兼容的文件系统,但它缺乏 Celesto 的预测性缓存和原子事务支持。另一个相关仓库是 MemoriaDB(GitHub: memoriadb/memoriadb,1.8k 星),它实现了一个针对 AI 智能体状态序列化优化的持久键值存储,但设计用于单节点部署,无法扩展到 PB 级别。Celesto 的专有实现似乎结合了两者的优点——分布式可扩展性与 POSIX 兼容性——同时加入了通用存储解决方案所缺乏的智能体特定优化。

| 指标 | Celesto PB 存储 | 标准对象存储(S3 兼容) | 本地 NVMe RAID |
|---|---|---|---|
| 最大容量 | 每沙盒 1 PB | 无限(理论上) | 30 TB(典型值) |
| 读取延迟(1 MB 对象) | 8 毫秒(热缓存) | 50-200 毫秒 | 0.1 毫秒 |
| 写入延迟(1 MB 对象) | 12 毫秒(热缓存) | 100-300 毫秒 | 0.2 毫秒 |
| 原子多对象事务 | 是 | 否 | 取决于文件系统 |
| 预测性预取 | 是 | 否 | 否 |
| 每 GB/月成本 | $0.023 | $0.021(标准层) | $0.10(硬件 + 电力) |

数据要点: Celesto 的存储实现了令人信服的平衡:它提供了云般的可扩展性和成本,同时热数据的延迟接近本地存储,并添加了通用解决方案无法提供的智能体特定功能(预测性缓存、原子事务)。仅预测性缓存带来的 73% 延迟降低,就可能使代码密集型工作流的智能体任务完成速度提升 2-3 倍。

关键玩家与案例研究

Celesto 并非唯一认识到持久内存对 AI 智能体重要性的公司,但它是第一个将其作为沙盒环境一等公民功能的公司。竞争格局可分为三个阵营:沙盒提供商、智能体框架和存储中间件。

沙盒提供商: 最直接的竞争对手是 Modal,它为 AI 工作负载提供临时云环境。Modal 支持持久卷,但每个卷限制为 100 GB,并且需要显式挂载,这给需要自动发现存储的智能体增加了摩擦。Replit 为编码智能体提供类似的沙盒,但其存储是会话范围的,不会在智能体运行时之外持久化。Google Colab 通过 Google Drive 挂载提供持久存储,但 15 GB 的免费限制和高延迟使其不适合 PB 级工作负载。Celesto 的 PB 容量和无缝集成使其在企业级智能体部署中具有明显优势。

智能体框架:LangChainAutoGPT 这样的框架曾尝试通过外部数据库解决内存问题——LangChain 的内存模块可以将对话历史存储在 Pinecone 或 Weaviate 等向量数据库中,而 AutoGPT 则使用本地 JSON 文件。然而,这些都是事后添加的解决方案,引入了延迟和复杂性。Celesto 的方法从根本上不同:它将持久内存直接嵌入到智能体的运行时环境中,消除了对外部数据库查询的需求,并允许智能体以原生速度访问数据。对于构建需要跨会话维护复杂状态的智能体的开发者来说,这意味着他们可以专注于智能体逻辑,而不是构建自定义存储基础设施。

更多来自 Hacker News

SlopenClaw:专为“专业拖延”而生的AI助手SlopenClaw是一款全新的AI代理,直接挑战了AI行业盛行的“不惜一切代价追求效率”的叙事。当大多数AI工具旨在自动化任务、加速工作流时,SlopenClaw的设计目标却是帮助知识工作者以更“专业”、更少内疚感的方式拖延。该代理能针对AI编程Token计划2026:开发者必须警惕的隐性成本与锁定策略AI编程市场已从模型能力竞争转向定价策略博弈。到2026年,从OpenAI、Anthropic到Cursor、Codeium等新兴玩家,所有主要供应商都推出了分层Token计划,将推理、上下文和优先级访问捆绑成不透明的套餐。我们的调查揭示,Hyperbola 拒绝 FSF 的 AI 立场:自由软件的不妥协底线Hyperbola,一款以对自由软件定义(Free Software Definition)毫不妥协而闻名的 GNU/Linux 发行版,已公开拒绝自由软件基金会(FSF)近期关于机器学习的立场声明。争议的核心在于机器学习模型的本质:它们并查看来源专题页Hacker News 已收录 5495 篇文章

相关专题

AI agents940 篇相关文章

时间归档

July 202658 篇已发布文章

延伸阅读

Magpie-Search:联邦搜索协议,能否终结AI对谷歌的依赖?Magpie-Search 是一个开源协议,它用去中心化的专业索引网络取代了集中式搜索 API,为 AI 智能体提供了韧性、隐私保护,并摆脱了供应商锁定。AINews 深入剖析其架构、关键参与者,以及对 AI 驱动信息检索未来的深远影响。CLI Market:为下一代AI代理打造的无形经济层一个名为CLI Market的新平台悄然上线,定位为首个专为AI代理构建的商业基础设施。通过让自主代理以标准化方式发现、购买和授权命令行工具与API,它标志着代理从被动信息消费者向数字经济主动参与者的关键转折。AI Agent研究者散落四方:缺失的“中央广场”正拖慢创新步伐一位知名AI Agent研究者公开询问“同行都在哪”,暴露了一个刺眼的真空:与拥有Hugging Face的LLM生态不同,Agent开发者们分散在Discord服务器和各类小众论坛中。这种碎片化正成为隐形瓶颈,阻碍该领域从孤立实验迈向系统AI代理的隐性税:Token效率为何成为新战场AI代理的Token消耗量是标准聊天机器人的10到100倍,这一隐性成本危机正威胁着实际部署。AINews深入探讨新兴的Token优化工程学科及其催生的中间件市场。

常见问题

这次公司发布“Celesto's PB-Scale Sandbox Memory: AI Agents Finally Get Permanent Recall”主要讲了什么?

The AI industry has long treated agent memory as a disposable resource—temporary, session-bound, and prone to catastrophic forgetting the moment a context window overflows. Celesto…

从“Celesto PB persistent storage pricing per GB”看,这家公司的这次发布为什么值得关注?

Celesto's persistent storage layer is built on a distributed object store architecture that abstracts away the complexity of managing petabyte-scale data while providing low-latency access for agent workflows. At its cor…

围绕“Celesto vs Modal for AI agent sandbox”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。