Strukto 推出 Mirage 虚拟文件系统:AI Agent 实现数据自主操控的关键基础设施

Hacker News May 2026
来源:Hacker NewsAI agentagent infrastructure归档:May 2026
Strukto 发布的 Mirage 引入了一种统一的虚拟文件系统,使 AI Agent 能够像操作本地磁盘一样读写云存储、数据库和本地文件,消除了碎片化的 API 调用。这一基础设施层有望将 Agent 从对话工具转变为自主任务执行者,重塑 Agent 与数字世界的交互方式。

AI Agent 领域长期以来受困于一个隐蔽却致命的瓶颈:尽管大语言模型在推理和规划能力上迅速提升,但它们实际操作数字世界的能力仍然显得相当原始。绝大多数 Agent 依赖于脆弱的 API 链或硬编码路径,这将其自主性严格限制在沙盒环境中,无法真正触及外部数据。Strukto 推出的 Mirage 通过构建统一的虚拟文件系统抽象直接解决了这一痛点——这是一个“虚拟驱动器”,能够透明地映射到 S3 存储桶、本地 SSD 甚至 Notion 数据库,允许 Agent 原生读写数据,而无需为每个存储服务单独重写逻辑。这一产品创新的时机至关重要。随着 Agent 从简单的对话助手演变为持久化、任务执行的实体,它们迫切需要持久记忆、中间结果存储以及复杂的状态管理能力。Mirage 正是为此而生,它填补了高级推理与实际行动之间的鸿沟,标志着 Agent 技术从概念验证向生产级应用的关键转变。通过消除碎片化的 API 调用,Mirage 让开发者能够专注于业务逻辑而非基础设施集成,极大地降低了 Agent 部署的复杂度。

技术深度剖析

Mirage 不仅仅是一个存储抽象层;它是一个从头开始构建的专用虚拟文件系统(VFS),旨在适应 AI Agent 独特的 I/O 模式。与传统的 VFS 层(例如 FUSE、Plan 9)不同,Mirage 必须处理 Agent 工作流中典型的高频、小型随机读写操作——想象一下,Agent 读取知识库片段,将部分结果写入临时缓冲区,然后追加到日志文件中——所有这些都在单次交互回合内完成。

架构与设计

在其核心,Mirage 实现了一个统一命名空间,将多个后端(S3、GCS、本地文件系统、SQL 数据库、键值存储如 Redis,甚至是 Notion 或 Airtable 等 SaaS API)映射到单个分层目录树中。每个后端都作为根目录下的子目录挂载,例如 `/mnt/s3/`、`/mnt/notion/`、`/mnt/local/`。这种映射是透明的:Agent 使用标准的 `open()`、`read()`、`write()`、`seek()` 和 `close()` 调用,Mirage 将这些调用翻译为适当的 API 请求或 SQL 查询。

| 后端类型 | 挂载点 | 延迟 (p50) | 延迟 (p99) | 吞吐量 (ops/sec) |
|---|---|---|---|---|
| Local SSD | `/mnt/local/` | 0.1 ms | 0.5 ms | 100,000 |
| S3 (same region) | `/mnt/s3/` | 5 ms | 20 ms | 5,000 |
| Notion API | `/mnt/notion/` | 150 ms | 500 ms | 200 |
| PostgreSQL | `/mnt/db/` | 2 ms | 10 ms | 10,000 |

数据洞察: 不同后端之间的延迟差异显而易见——本地 SSD 的速度是 Notion API 的 1,500 倍。Mirage 必须实施智能缓存和预取机制,以避免 Agent 推理循环被慢速后端阻塞。

关键工程挑战

1. 一致性模型: Mirage 默认采用弱一致性模型,特定路径可选强一致性。这是一种 deliberate 的权衡:Agent 通常为了速度而容忍最终一致性,但关键操作(例如写入检查点)需要立即可见性。Mirage 暴露了一个 `sync()` 调用,将所有待处理写入刷新到后端。

2. 缓存层: 多层缓存位于 Agent 和后端之间。热数据保留在内存 LRU 缓存中(大小可配置,默认 1 GB),温数据存储在本地 SSD 上,冷数据按需获取。缓存失效通过 TTL 处理,对于一致性敏感的路径则采用写透策略。

3. 并发控制: Agent 可能会生成多个子 Agent 或工具,并发访问同一文件。Mirage 实施了带有版本号的乐观锁。如果检测到写入冲突,后来的写入将被拒绝,Agent 必须重试。这比分布式锁更简单,且符合 Agent 的重试模式。

4. POSIX 子集: Mirage 不实现完整的 POSIX 规范。它省略了硬链接、符号链接(内部使用除外)以及 `chmod`/`chown`。重点在于 `open`、`read`、`write`、`seek`、`close`、`mkdir`、`rmdir`、`unlink` 和 `rename`。这个子集覆盖了 95% 的 Agent 用例,同时保持实现精简。

开源参考

虽然 Strukto 尚未开源 Mirage,但最接近的类比是 [agentfs](https://github.com/agentfs/agentfs) 项目(1.2k stars),这是一个针对 LLM Agent 的概念验证 VFS,将文件映射到函数调用。Agentfs 更简单——它使用基于 JSON 的虚拟目录——但缺乏 Mirage 的后端多样性和性能优化。另一个相关项目是 [fsspec](https://github.com/fsspec/filesystem_spec)(3.5k stars),这是一个用于抽象文件系统的 Python 库,但它不是为 Agent 工作负载设计的,也没有内置缓存或并发控制。

要点: Mirage 的技术差异化在于其特定于 Agent 的设计:弱一致性、乐观锁以及针对高频小型 I/O 优化的 POSIX 子集。这不是一个通用的 VFS;它是专为 Agent 运行时设计的专用层。

关键参与者与案例研究

Strukto:基础设施布局

Strukto 是一家相对较新的初创公司(成立于 2024 年,从匿名投资者那里筹集了 800 万美元种子资金),此前专注于 Agent 编排框架。Mirage 是他们在观察到客户将 40% 的工程时间花在存储集成上之后,向基础设施领域的 pivot。团队包括来自 Google FUSE 团队和 AWS S3 团队的前工程师。

竞争解决方案

| 解决方案 | 类型 | 后端支持 | 延迟 | 并发 | 开源 |
|---|---|---|---|---|---|
| Mirage | 虚拟 FS | S3, GCS, local, DB, Notion, Airtable | 低 (cached) | 乐观锁 | 否 |
| LangChain's BaseStore | 抽象 | S3, local, MongoDB, Redis | 中 | 无 (单线程) | 是 |
| AutoGPT's FileManager | 工具包装 | 仅限本地 | 低 | 无 | 是 |
| CrewAI's Storage | 工具包装 | S3, local | 中 | 无 | 是 |

数据洞察: 现有解决方案要么太窄(AutoGPT、CrewAI),要么缺乏并发控制(LangChain)。Mirage 是首个将存储视为统一基础设施层而非临时工具包装的解决方案,这为 Agent 的规模化部署奠定了坚实基础。

更多来自 Hacker News

旧手机变身AI集群:分布式大脑挑战GPU霸权在AI开发与巨额资本支出紧密挂钩的时代,一种激进的替代方案从意想不到的源头——电子垃圾堆中诞生。研究人员成功协调了数百台旧手机组成的分布式集群——这些设备通常因无法运行现代应用而被丢弃——来执行大型语言模型的推理任务。其核心创新在于一个动态元提示工程:让AI智能体真正可靠的秘密武器多年来,AI智能体一直饱受一个致命缺陷的困扰:它们开局强势,但很快便会丢失上下文、偏离目标,沦为不可靠的玩具。业界尝试过扩大模型规模、增加训练数据,但真正的解决方案远比这些更优雅。元提示工程(Meta-Prompting)是一种全新的提示架Google Cloud Rapid 为 AI 训练注入极速:对象存储的“涡轮增压”时代来了Google Cloud 推出 Cloud Storage Rapid,标志着云存储架构的根本性转变——从被动的数据仓库,跃升为 AI 计算管线中的主动参与者。传统对象存储作为数据湖的基石,其固有的延迟和吞吐量限制在大语言模型训练时暴露无遗查看来源专题页Hacker News 已收录 3255 篇文章

相关专题

AI agent109 篇相关文章agent infrastructure27 篇相关文章

时间归档

May 20261212 篇已发布文章

延伸阅读

BaseLedger:开源防火墙,驯服AI Agent的API成本狂潮AI Agent自主决策的狂飙突进,正悄然引发一场运营危机:API成本失控与系统稳定性崩塌。BaseLedger以开源API配额防火墙切入,将混乱的API消耗转化为可管理、可审计的交易记录,为新兴的Agent经济构建治理层。AI Agent成绩单:API可靠性成为衡量智能体质量的新标尺一套全新的AI Agent API性能评分系统悄然上线,标志着行业评估智能体质量的方式正在发生根本性转变。我们的分析发现,随着AI Agent从演示阶段走向生产环境,API一致性、延迟控制和错误处理能力正成为真正的差异化因素。OfficeOS:开源“AI智能体版Kubernetes”,让规模化部署不再遥不可及开源项目OfficeOS正试图攻克AI智能体领域最棘手的难题:如何在生产环境中管理数百个自主运行的智能体。通过提供任务调度、资源分配和错误恢复机制,它将自己定位为智能体时代的Kubernetes,标志着行业焦点正从“能否构建一个智能体”转向LCM记忆突破:AI代理迈入深度上下文感知时代一项名为长上下文记忆(LCM)的新技术正在彻底改变AI代理,使其能够在数千步交互中保持连贯推理。这一突破解锁了代码审计、法律分析和科学研究等专业代理,标志着从通用聊天机器人向深度上下文感知专业工具的转变。

常见问题

这次公司发布“Mirage Virtual File System Lets AI Agents Truly Manipulate Data”主要讲了什么?

AI agents have long suffered from a hidden bottleneck: while large language models rapidly improve in reasoning and planning, their ability to actually manipulate the digital world…

从“Mirage AI agent file system vs FUSE comparison”看,这家公司的这次发布为什么值得关注?

Mirage is not merely another storage abstraction; it is a purpose-built virtual file system (VFS) designed from the ground up for the unique I/O patterns of AI agents. Unlike traditional VFS layers (e.g., FUSE, Plan 9)…

围绕“Strukto Mirage security access control for enterprise”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。