技术深度解析
Fractional AI的核心创新在于其能够将通常由NVIDIA H100或A100节点组成的单体GPU集群,解聚为可根据工作负载需求动态分配的微实例。这一能力通过内核级虚拟化、内存池化以及一个利用强化学习来优化并发推理与训练任务资源分配的调度器得以实现。
Fractional AI的架构采用了一个位于硬件与操作系统之间的自定义虚拟机监控器。它利用NVIDIA的MIG(多实例GPU)技术进行物理分区,并通过软件定义的边界进行扩展,从而允许在亚秒级内重新分配算力切片。该调度器经过数百万个真实AI任务轨迹的训练,能够预测需求模式并预分配资源,以最小化延迟并最大化利用率——其利用率通常超过85%,而标准云GPU实例的行业平均水平仅为40-60%。
| 指标 | 标准云GPU(AWS p4d.24xlarge) | Fractional AI平台 | 提升幅度 |
|---|---|---|---|
| 平均GPU利用率 | 45% | 87% | +93% |
| 每百万Token成本(Llama 3 70B推理) | $0.85 | $0.32 | -62% |
| 分配100个GPU所需时间 | 12分钟 | 45秒 | -94% |
| 最小可用算力单元 | 1个完整GPU | 相当于0.1个GPU | 10倍粒度 |
数据要点: Fractional AI平台的GPU利用率几乎是标准云服务的两倍,这意味着每个推理Token的成本降低了62%。这一效率提升正是黑石与Anthropic合资背后的核心经济驱动力。
在软件方面,Fractional AI已将其调度器的关键组件以Apache 2.0许可证开源。该代码仓库名为“fractional-scheduler”,在GitHub上已获得超过4500颗星,并被学术实验室和中等规模的AI公司所采用。该调度器采用多智能体强化学习框架,其中每个GPU节点充当独立智能体,与中央编排器协商资源交易。这种去中心化方法减少了集中式调度的开销,并能随集群规模线性扩展。
Anthropic在合资公司中的角色是提供模型优化层。Anthropic的研究团队开发了自定义CUDA内核,可将Claude模型推理的内存带宽消耗降低高达40%。这些内核将直接集成到Fractional AI的运行时中,使平台能够提供“Claude优化”层级,为Anthropic的模型保证更低的延迟和更高的吞吐量。这种硬件与模型之间的紧密集成,是其区别于通用云服务商的关键差异化优势。
关键参与者与案例研究
黑石带来的不仅仅是资本。该公司的基础设施团队在大型数据中心建设融资方面拥有丰富经验,包括2024年对可再生能源驱动的AI数据中心做出的70亿美元承诺。这笔交易标志着黑石首次直接运营参与AI算力领域,从被动投资者转变为主动运营者。
Anthropic贡献了其Claude模型家族以及一个由30名优化工程师组成的团队。Anthropic的CEO Dario Amodei曾公开表示,“AI安全研究的最大瓶颈是算力成本”,因此这家合资公司是降低安全导向型研究门槛的战略举措。合资公司将提供“安全优先”层级,以补贴价格预留算力资源用于对齐研究。
Fractional AI由前Google TPU工程师和斯坦福研究人员于2023年创立。在被收购前,该公司已从Sequoia Capital和Index Ventures筹集了1.2亿美元,并在三个数据中心部署了其平台,覆盖15000个GPU。其客户群包括多家知名AI初创公司和中等规模企业。
| 公司 | 收购前年度算力支出 | 合资后预计支出 | 节省幅度 |
|---|---|---|---|
| Midjourney | $4500万 | $2800万 | 38% |
| Replit | $1200万 | $720万 | 40% |
| Jasper AI | $800万 | $480万 | 40% |
| Cohere | $6000万 | $3800万 | 37% |
数据要点: Fractional AI现有客户的预计节省幅度在37%至40%之间,验证了该平台的效率主张。对Anthropic而言,这创造了一个可以被追加销售Claude模型的忠实客户群;而对黑石来说,则获得了一条由硬资产支撑的经常性收入流。
行业影响与市场动态
此次收购直接挑战了三大超大规模云服务商——Amazon Web Services、Microsoft Azure和Google Cloud——它们共同控制着超过65%的AI算力市场。这些服务商历来通过将算力与专有服务和锁定机制捆绑销售,在GPU实例上维持高利润率。黑石与Anthropic的合资公司引入了一种新的竞争态势:一种资本高效、模式创新的AI算力供给方式。