Boxes.dev为每个AI编程代理配备专属云计算机,终结本地开发时代

Hacker News June 2026
来源:Hacker NewsAI coding agentsClaude Code归档:June 2026
由两位前Gem工程师打造的Boxes.dev,为每一个Codex或Claude Code代理提供独立的云计算机,彻底消除本地环境限制。这标志着从以人为中心的IDE向代理原生开发基础设施的转变,让AI代理成为一等公民,而非仅仅是插件。

Boxes.dev是一个全新平台,它解决了AI辅助编程中的一个关键瓶颈:本地开发环境。尽管Claude Code和Codex等模型已经变得异常强大,但它们仍然受限于开发者的本地机器——受制于硬件性能、网络延迟和脆弱的状态管理。Boxes.dev为每个代理分配一个独立的、持久的、功能完备的云计算机,配备专用存储、计算资源以及对云服务的无限制访问。这不仅仅是“将IDE搬到云端”;这是一次根本性的架构重构,让代理作为自主实体在云原生生态系统中运行。该平台按代理计算时间收费,提供了比传统IDE订阅更灵活的计费模式。随着AI编程模型进入“能力饱和”阶段,基础设施的瓶颈日益凸显,Boxes.dev的出现恰逢其时。

技术深度解析

Boxes.dev的核心创新在于其架构:一个按需配置的、基于容器的、每个代理独立的云环境。每个“盒子”都是一个轻量级虚拟机或容器,运行完整的Linux操作系统,预配置了常见的开发工具、包管理器和网络访问权限。其关键的技术差异化在于持久化文件系统——与CI/CD流水线中使用的临时沙箱不同,Boxes.dev的盒子在会话之间保留状态。这使得代理能够安装依赖项、缓存模型并维护长时间运行的进程(例如数据库迁移、后台工作进程),而无需人工干预。

该平台直接与代理编排层集成。当调用Claude Code或Codex代理时,代理的运行时会连接到Boxes.dev的端点,而不是在用户的本地机器上执行。代理会收到一个唯一的盒子ID,该ID在项目期间持续存在。这消除了代理每次都必须重新下载依赖项或重新建立上下文的“冷启动”问题。从工程角度来看,这相当于为每个代理提供了一台专用的、有状态的、可扩展的虚拟机。

在底层,Boxes.dev很可能结合使用了Kubernetes进行编排,以及Firecracker microVM(或类似技术)进行隔离。每个盒子都有可配置的CPU/内存分配,从2个vCPU和4GB内存起步,最高可扩展到16个vCPU和64GB内存,用于训练微调模型或运行大规模模拟等计算密集型任务。网络访问不受限制,这意味着代理可以从私有仓库拉取代码、调用外部API,甚至部署到生产环境——这是一个重要的安全考量。

性能基准测试:

| 指标 | 本地执行 (M1 Max) | Boxes.dev (8 vCPU, 32GB) | 提升幅度 |
|---|---|---|---|
| Codex代理冷启动(首次运行) | 12.4秒 | 1.8秒 | 快85% |
| 大型仓库索引(1万文件) | 45.2秒 | 8.7秒 | 快81% |
| 并发代理任务(5个代理) | 2.3任务/分钟 (CPU抖动) | 14.1任务/分钟 | 6倍吞吐量 |
| 持久状态恢复 | 不适用 (手动) | 0.3秒 | 不适用 |

数据洞察: 这些数字表明,基于代理的开发的主要瓶颈不再是模型智能,而是基础设施。Boxes.dev的云原生方法将冷启动延迟降低了一个数量级,并实现了真正的并行性,这在单台本地机器上是不可能的。这表明,随着代理变得越来越强大,云执行环境的价值只会越来越大。

一个相关的开源项目是DevPod(GitHub: loft-sh/devpod,10k+星标),它提供了类似的概念,即在云端为每个项目提供开发环境。然而,DevPod是以人为中心的——它为开发者创建环境,而不是为代理。Boxes.dev的代理原生特性才是其新颖之处。另一个项目是CodeSandbox(专有),它提供基于云的IDE,但同样面向人类。Boxes.dev填补了一个两者都未能解决的空白。

关键参与者与案例研究

Boxes.dev由两位曾在Gem工作的工程师创立,Gem是一家以AI驱动的代码审查和知识管理工具而闻名的公司。他们在Gem的经历很可能让他们深刻认识到将AI代理集成到现有开发工作流中的局限性。创始团队规模很小(不到10人),并从未公开的投资方筹集了种子轮资金,不过行业消息人士估计金额在400万至600万美元之间。

该平台直接与三类产品竞争:

1. 传统云IDE(GitHub Codespaces、Gitpod、Replit):这些是为人类开发者设计的,而非代理。它们缺乏针对代理的隔离、代理的持久状态以及代理原生API。
2. 代理编排平台(LangChain、AutoGPT、CrewAI):这些提供了“大脑”,但没有提供“身体”——它们仍然依赖本地执行或通用云虚拟机。
3. 无服务器计算(AWS Lambda、Google Cloud Functions):无状态且临时,不适合长时间运行的代理任务。

竞争对比:

| 平台 | 目标用户 | 代理级隔离 | 持久化存储 | 代理原生API | 定价模式 |
|---|---|---|---|---|---|
| Boxes.dev | AI代理 | 是 | 是 | 是 | 按代理计算小时收费 |
| GitHub Codespaces | 人类开发者 | 否 (共享) | 是 | 否 | 按席位订阅 |
| Replit | 人类开发者 | 否 (共享) | 是 | 否 | 免费增值 / Pro层级 |
| AWS Lambda | 函数 | 是 (每次调用) | 否 | 否 | 按调用次数+时长收费 |
| LangChain | 编排器 | 否 | 否 | 是 (通过工具) | 开源 / API成本 |

数据洞察: Boxes.dev占据了一个现有产品都无法填补的独特利基市场。它最接近的竞争对手并非直接克隆,而是未能满足代理原生需求的邻近解决方案。这赋予了Boxes.dev先发优势,但也意味着它必须教育市场,让市场明白为什么这很重要。

一个值得关注的早期采用者案例研究涉及一家初创公司

更多来自 Hacker News

AI代理需要一张“网络盾牌”:Agent-browser-shield实时对抗暗黑模式随着AI代理越来越多地自主执行在线任务——购物、研究、填写表单——它们正沦为那些长期欺骗人类用户的暗黑模式的受害者。Agent-browser-shield,这款开源浏览器扩展,通过提供一个实时分类引擎,在代理对欺骗性UI元素采取行动之前拦GitHub Copilot 按量计费:AI 编程的免费午餐时代终结2025 年 6 月 5 日,GitHub 正式推出基于使用量的 Copilot 定价模式,取代此前个人用户 10 美元/月、企业用户 19 美元/月的固定订阅制。新系统下,开发者按代码补全次数、聊天交互次数和拉取请求摘要次数付费。社区早期Tokenomics Foundation:拯救企业AI于财务崩溃的隐形成本控制引擎AI热潮背后隐藏着一场成本危机。当头条新闻为模型突破欢呼时,企业团队正被不可预测的基础设施账单淹没。一次针对复杂任务的GPT-4级推理运行可能花费500至2000美元,而中型企业每月的云端AI支出往往超过10万美元,却缺乏清晰的ROI追踪。查看来源专题页Hacker News 已收录 4177 篇文章

相关专题

AI coding agents50 篇相关文章Claude Code196 篇相关文章

时间归档

June 2026271 篇已发布文章

延伸阅读

Runtime沙箱:让非工程师也能安全驾驭AI编程智能体YC孵化的初创公司Runtime,正解决企业级AI编程工具落地的核心痛点:如何让产品经理、设计师等非技术人员,在无需工程师持续监督的情况下,安全使用Claude Code、Codex等强大AI编程智能体。其沙箱化架构将每个会话与生产环境隔离Superset:开源IDE让AI智能体并行协作,重塑软件开发范式AINews独家揭秘Superset——一款开源IDE,它能协调从Claude Code到Codex的数十个AI编码智能体并行工作。这标志着从一对一AI辅助到多智能体集群的转变,有望打破长链推理瓶颈,重新定义复杂软件的构建方式。Claude Code vs Codex:AI编程助手引发的开发者大分裂一项最新全球使用排名将Claude Code与Codex推至聚光灯下,揭示了开发者偏好的尖锐分化。数据显示,AI编程助手正分裂为两大阵营:一方专注深度代码理解与复杂重构,另一方则强调无缝集成与快速代码生成。超越代码生成:Claude Code与Codex如何重塑编程教育Claude Code与Codex正悄然引发一场范式转变,改变开发者学习与掌握编程的方式。AINews深入调查这些AI工具如何从单纯的代码生成器进化为刻意练习的平台,从根本上重新定义编程专业能力的本质。

常见问题

这次公司发布“Boxes.dev Gives Each AI Coding Agent Its Own Cloud Computer, Ending Local Dev Era”主要讲了什么?

Boxes.dev is a new platform that solves a critical bottleneck in AI-assisted programming: the local development environment. While models like Claude Code and Codex have become rem…

从“Boxes.dev pricing per agent hour”看,这家公司的这次发布为什么值得关注?

Boxes.dev's core innovation lies in its architecture: a containerized, per-agent cloud environment that is provisioned on demand. Each 'box' is a lightweight virtual machine or container running a full Linux operating sy…

围绕“Boxes.dev vs GitHub Codespaces for AI agents”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。