黑石与Anthropic合资收购Fractional AI:AI算力基础设施进入新纪元

Hacker News June 2026
来源:Hacker News归档:June 2026
私募巨头黑石与AI领军企业Anthropic联手成立合资公司,收购算力平台Fractional AI,打造“资本+模型+算力”垂直整合的超级引擎。此举有望大幅降低企业AI成本,并直接挑战传统云服务商的市场主导地位。

黑石与Anthropic联合收购Fractional AI,标志着AI基础设施融资模式的范式转变。Fractional AI专注于将昂贵的GPU集群“碎片化”为按需、细粒度的算力单元。合资公司整合了Anthropic的前沿模型能力、黑石的雄厚资本储备以及Fractional AI的高效资源分配技术。这种垂直整合直接挑战了AWS、Google Cloud和Microsoft Azure等超大规模云服务商的定价模式——它们长期主导着AI算力的成本结构。通过为企业提供涵盖模型推理、硬件优化和灵活算力定价的统一服务,新实体旨在为中小企业解锁AI应用的大门。

技术深度解析

Fractional AI的核心创新在于其能够将通常由NVIDIA H100或A100节点组成的单体GPU集群,解聚为可根据工作负载需求动态分配的微实例。这一能力通过内核级虚拟化、内存池化以及一个利用强化学习来优化并发推理与训练任务资源分配的调度器得以实现。

Fractional AI的架构采用了一个位于硬件与操作系统之间的自定义虚拟机监控器。它利用NVIDIA的MIG(多实例GPU)技术进行物理分区,并通过软件定义的边界进行扩展,从而允许在亚秒级内重新分配算力切片。该调度器经过数百万个真实AI任务轨迹的训练,能够预测需求模式并预分配资源,以最小化延迟并最大化利用率——其利用率通常超过85%,而标准云GPU实例的行业平均水平仅为40-60%。

| 指标 | 标准云GPU(AWS p4d.24xlarge) | Fractional AI平台 | 提升幅度 |
|---|---|---|---|
| 平均GPU利用率 | 45% | 87% | +93% |
| 每百万Token成本(Llama 3 70B推理) | $0.85 | $0.32 | -62% |
| 分配100个GPU所需时间 | 12分钟 | 45秒 | -94% |
| 最小可用算力单元 | 1个完整GPU | 相当于0.1个GPU | 10倍粒度 |

数据要点: Fractional AI平台的GPU利用率几乎是标准云服务的两倍,这意味着每个推理Token的成本降低了62%。这一效率提升正是黑石与Anthropic合资背后的核心经济驱动力。

在软件方面,Fractional AI已将其调度器的关键组件以Apache 2.0许可证开源。该代码仓库名为“fractional-scheduler”,在GitHub上已获得超过4500颗星,并被学术实验室和中等规模的AI公司所采用。该调度器采用多智能体强化学习框架,其中每个GPU节点充当独立智能体,与中央编排器协商资源交易。这种去中心化方法减少了集中式调度的开销,并能随集群规模线性扩展。

Anthropic在合资公司中的角色是提供模型优化层。Anthropic的研究团队开发了自定义CUDA内核,可将Claude模型推理的内存带宽消耗降低高达40%。这些内核将直接集成到Fractional AI的运行时中,使平台能够提供“Claude优化”层级,为Anthropic的模型保证更低的延迟和更高的吞吐量。这种硬件与模型之间的紧密集成,是其区别于通用云服务商的关键差异化优势。

关键参与者与案例研究

黑石带来的不仅仅是资本。该公司的基础设施团队在大型数据中心建设融资方面拥有丰富经验,包括2024年对可再生能源驱动的AI数据中心做出的70亿美元承诺。这笔交易标志着黑石首次直接运营参与AI算力领域,从被动投资者转变为主动运营者。

Anthropic贡献了其Claude模型家族以及一个由30名优化工程师组成的团队。Anthropic的CEO Dario Amodei曾公开表示,“AI安全研究的最大瓶颈是算力成本”,因此这家合资公司是降低安全导向型研究门槛的战略举措。合资公司将提供“安全优先”层级,以补贴价格预留算力资源用于对齐研究。

Fractional AI由前Google TPU工程师和斯坦福研究人员于2023年创立。在被收购前,该公司已从Sequoia Capital和Index Ventures筹集了1.2亿美元,并在三个数据中心部署了其平台,覆盖15000个GPU。其客户群包括多家知名AI初创公司和中等规模企业。

| 公司 | 收购前年度算力支出 | 合资后预计支出 | 节省幅度 |
|---|---|---|---|
| Midjourney | $4500万 | $2800万 | 38% |
| Replit | $1200万 | $720万 | 40% |
| Jasper AI | $800万 | $480万 | 40% |
| Cohere | $6000万 | $3800万 | 37% |

数据要点: Fractional AI现有客户的预计节省幅度在37%至40%之间,验证了该平台的效率主张。对Anthropic而言,这创造了一个可以被追加销售Claude模型的忠实客户群;而对黑石来说,则获得了一条由硬资产支撑的经常性收入流。

行业影响与市场动态

此次收购直接挑战了三大超大规模云服务商——Amazon Web Services、Microsoft Azure和Google Cloud——它们共同控制着超过65%的AI算力市场。这些服务商历来通过将算力与专有服务和锁定机制捆绑销售,在GPU实例上维持高利润率。黑石与Anthropic的合资公司引入了一种新的竞争态势:一种资本高效、模式创新的AI算力供给方式。

更多来自 Hacker News

无标题AINews has uncovered CrankGPT, a portable AI device that eschews all external infrastructure. It is powered solely by a 长寿遇见智能:抗衰老药物与AI五大核心问题的交汇延长人类寿命的竞赛与追求通用人工智能的探索并非两条平行叙事。它们正汇聚于一个深刻的核心原则:主动干预和重构复杂系统的能力。在抗衰老领域,表观遗传重编程和衰老细胞清除等疗法已超越延缓衰退,进入分子层面逆转生物钟的阶段——这相当于重新编译生命的Transload:用安防摄像头把仓库变成AI称重站几十年来,零担货运(LTL)行业一直受困于一个根本性问题:货物测量不准确。托运人为节省成本而低报货物尺寸,承运商因空间利用率低而损失收入,围绕提单的纠纷更是屡见不鲜。传统解决方案依赖昂贵且专用的尺寸测量设备——激光扫描仪、传送带传感器或人工查看来源专题页Hacker News 已收录 4415 篇文章

时间归档

June 2026864 篇已发布文章

延伸阅读

LLM推理的隐秘革命:系统程序员手握5倍加速密钥大语言模型推理的瓶颈已从模型架构根本性地转向系统级工程。内存带宽、内核融合与GPU调度主导性能,在不改变任何模型参数的情况下,可实现2至5倍的吞吐量提升。这彻底改变了AI产品的构建与部署方式。SSV稀疏验证:'偷懒'的LLM推理如何将成本降低3倍一篇新论文提出稀疏推测验证(SSV)技术,通过仅验证关键令牌,大幅降低大语言模型推理成本。该方法在不牺牲输出质量的前提下实现2-3倍加速,直击云端与边缘部署的核心成本痛点。停止Token竞赛:AI部署为何需要效率而非规模AI行业沉迷于生成更多token,但这种蛮力策略正在浪费算力并侵蚀用户价值。AINews深度剖析从“越大越好”到“更智能部署”的关键转向,揭示领先企业如何以精准度而非数量重新定义成功。LLM Inference Cost Drops 85%: The Five-Layer Optimization That Changes EverythingA systematic five-layer optimization framework is driving large language model inference costs from $200 per million tok

常见问题

这起“Blackstone-Anthropic JV Buys Fractional AI: A New Era for AI Compute Infrastructure”融资事件讲了什么?

In a move that signals a paradigm shift in AI infrastructure financing, Blackstone and Anthropic have jointly acquired Fractional AI, a platform that specializes in 'fragmenting' e…

从“How does Fractional AI's GPU fragmentation technology work technically?”看,为什么这笔融资值得关注?

The core innovation behind Fractional AI is its ability to disaggregate monolithic GPU clusters—typically composed of NVIDIA H100 or A100 nodes—into micro-instances that can be allocated dynamically based on workload req…

这起融资事件在“What are the implications of Blackstone-Anthropic JV for AWS and Azure pricing?”上释放了什么行业信号?

它通常意味着该赛道正在进入资源加速集聚期,后续值得继续关注团队扩张、产品落地、商业化验证和同类公司跟进。