技术深度解析
孙正义2400亿美元的利润根植于一个基本的技术洞察:基于Transformer模型的缩放定律(Scaling Laws)。OpenAI的GPT系列,从GPT-3(1750亿参数)到GPT-4(估计在混合专家架构中达到1.8万亿参数),已经证明模型性能会随着计算量、数据和参数的增加而可预测地提升。这不是线性关系,而是一种幂律关系。孙正义押注OpenAI会继续沿着这条缩放曲线前进,而他们确实做到了。
关键的技术推动力是“计算飞轮”。OpenAI的训练任务如今消耗着数万块NVIDIA H100和B200 GPU,仅单个GPT-5级别的训练集群,硬件成本就超过100亿美元。软银的资本直接为这些基础设施提供了资金,包括与微软和Oracle合作建设的巨型“星际之门”(Stargate)超级计算机项目。这些系统的架构——利用NVIDIA的NVLink交换机和InfiniBand网络,创建一个节点间近乎零延迟的单一逻辑GPU——是一项极少数组织能够复制的工程壮举。
一个关键的技术里程碑是从纯自回归语言模型向“世界模型”的转变。OpenAI的o1和o3系列引入了思维链推理,有效地让模型在回答前进行“思考”,这显著提升了在复杂数学、编程和科学推理任务上的表现。这不是一个微小的调整;它代表了一种新的模型架构范式,其中推理时的计算量会根据问题难度动态分配。
对于关注开源方面的读者,GitHub仓库“KoboldAI/LLM-Notebooks”(超过5000颗星)提供了这些缩放技术的实用实现,包括混合专家和推测解码。“vllm”仓库(超过40000颗星)是高效服务大型模型的事实标准,它使用PagedAttention来管理GPU内存,这一技术很可能也被OpenAI自身的服务基础设施所采用。
数据表:前沿模型缩放与性能
| 模型 | 估计参数 | 架构 | MMLU得分 | MATH得分 | 训练计算量 (FLOPs) |
|---|---|---|---|---|---|
| GPT-3 | 175B | 密集Transformer | 43.9 | 5.2 | 3.14e23 |
| GPT-4 | ~1.8T (估计) | 混合专家 | 86.4 | 42.5 | ~2.1e25 |
| GPT-4o | ~200B (活跃) | 多模态密集 | 88.7 | 76.6 | ~1.0e25 |
| o1 | 未知 | 思维链 | 92.3 | 94.8 | ~5.0e25 (推理) |
| o3 | 未知 | 高级思维链 | 96.4 | 98.2 | ~1.0e26 (推理) |
数据要点: 从GPT-3到o3的跃迁代表了训练计算量500倍的提升,以及针对难题推理计算量1000倍的提升。这验证了孙正义的赌注:计算量每提升一个数量级,就能解锁基准性能不成比例的飞跃,这直接转化为企业合同中的商业价值。
关键玩家与案例研究
孙正义的策略在其集中性上是独一无二的。当其他主要投资者如红杉资本、Andreessen Horowitz和老虎环球基金将赌注分散在数十家AI初创公司时,孙正义将软银愿景基金的绝大部分押注在了一个篮子里:OpenAI。这是一个关于信念投资的经典案例。
OpenAI本身已从一个非营利研究实验室演变为估值3000亿美元的营利性巨头。关键人物包括CEO Sam Altman,他带领公司度过了内部动荡和外部竞争;以及联合创始人兼前首席科学家Ilya Sutskever,他的离职并创立Safe Superintelligence Inc. (SSI) 凸显了安全与速度之间的紧张关系。SSI估值100亿美元,如今是一个直接竞争对手,但它缺乏软银资本为OpenAI提供的计算基础设施。
与其他AI基础设施投资的直接对比颇具启发性:
数据表:AI基础设施投资对比
| 投资者/公司 | 关键资产 | 估计投资额 | 当前估值 | 投资回报倍数 |
|---|---|---|---|---|
| 软银 (孙正义) | OpenAI | ~300亿美元 (累计) | ~3000亿美元 | ~10倍 |
| 微软 | OpenAI (49%股份) | ~130亿美元 | ~1500亿美元 (估计) | ~11倍 |
| 谷歌 | DeepMind | ~5亿美元 | ~500亿美元 (估计) | ~100倍 |
| 亚马逊 | Anthropic | ~80亿美元 | ~600亿美元 (估计) | ~7.5倍 |
| 英伟达 | GPU销售 | 不适用 (产品) | 3.3万亿美元市值 | 不适用 |
数据要点: 尽管谷歌收购DeepMind显示出更高的倍数,但那是更早的赌注。孙正义的回报因其绝对的规模以及产生速度(不到5年)而引人注目。英伟达作为“卖铲人”,在绝对价值上捕获了最多,但孙正义对单一应用层公司的押注是前所未有的。
其他值得注意的玩家包括xAI(Elon Musk的创业公司),已筹集60亿美元在孟菲斯建设一个10万块H100的集群;以及Mistral AI,一个欧洲挑战者,以极少的计算资源实现了具有竞争力的性能。