技术深度解析
微软终止与OpenAI的利润分成协议,绝非简单的合同变更,它反映了前沿AI模型融资与部署方式的根本性架构转变。最初的协议——微软投资130亿美元,换取OpenAI 49%的利润分成(直至收回投资),之后升至75%——是基于OpenAI专有的GPT架构设计的。然而,随着OpenAI从纯研究实验室转型为拥有自有API、企业销售和消费级产品(ChatGPT、DALL-E)的产品公司,利润分成模式成为了摩擦点。
从工程角度看,这次分拆暴露了模型开发与基础设施所有权之间的张力。微软Azure云为OpenAI的训练和推理提供算力支撑,但微软也在开发自有模型(Phi系列、Copilot集成)。利润分成本质上意味着微软在自己云上使用OpenAI模型时,是在向自己付费——一种低效的循环流动。终止协议后,微软可以优化自有模型栈,而无需再补贴一个竞争对手。
在中国方面,修订后的《企业国有资产法》对AI基础设施引入了技术合规要求。投资AI的国有企业(SOEs)现在必须将大模型、训练数据集和算力集群登记为国有资产,接受审计、估值和处置监管。这对模型架构有直接影响:国有企业将青睐具有透明血统、可审计训练数据和可解释输出的模型——这有利于PyTorch等开源框架,而非专有黑盒系统。
值得关注的GitHub仓库:
- CogVideo (THUDM):开源文生视频模型,已获25,000+星标。其架构采用3D VAE和Transformer,在新合规制度下,正被中国国有企业用于媒体生成。
- ChatGLM-6B (THUDM):拥有40,000+星标,是中文LLM的标杆。其开源特性使其成为需要可审计性的国有企业部署的首选。
- Qwen (Alibaba Cloud):Qwen2.5-72B拥有20,000+星标,广泛用于中国企业。其Apache 2.0许可证符合新的合规要求。
基准对比:中国开源模型
| 模型 | 参数 | C-Eval分数 | MMLU分数 | GitHub星标 | 许可证 |
|---|---|---|---|---|---|
| Qwen2.5-72B | 72B | 86.4 | 85.3 | 20,000+ | Apache 2.0 |
| ChatGLM-6B | 6B | 72.8 | 68.9 | 40,000+ | Apache 2.0 |
| Yi-34B (01.AI) | 34B | 81.2 | 80.5 | 15,000+ | Apache 2.0 |
| Baichuan2-13B | 13B | 78.5 | 76.3 | 10,000+ | Apache 2.0 |
数据要点:采用Apache 2.0许可证的开源模型主导了中国生态系统,其C-Eval分数(中文基准)与专有模型不相上下。新的国资法可能会加速这些模型的采用,因为它们为合规审计提供了完全的透明度。
关键玩家与案例研究
微软与OpenAI:分道扬镳
微软的决定是一次战略调整。在CEO Satya Nadella的领导下,微软已将Copilot嵌入整个产品套件——Office、GitHub、Azure、Windows。与OpenAI的利润分成意味着,微软每售出一个Copilot订阅,就要向OpenAI支付20%的版税。随着微软自有AI模型(Phi-3、Orca)的改进,支付这笔'税'的理由越来越弱。现在由Sam Altman领导的OpenAI必须加速直接企业销售和消费者订阅,以弥补失去的收入流。
Apollo与Manus:被叫停的收购
Apollo是一家管理资产达5000亿美元的私募股权公司,试图收购专注于自主智能体的中国AI初创公司Manus。国家发改委以国家安全为由,依据新收紧的外资审查框架叫停了这笔交易。Manus的技术——使AI智能体能够跨企业系统自主执行多步骤工作流——被视为关键基础设施风险。这是首次以国家安全为由叫停AI领域的收购案,开创了先例。
国有企业:新的合规负担
中国三大电信运营商——中国移动、中国联通、中国电信——是中国最大的AI基础设施部署方。它们共同投资了超过2000亿元人民币(约280亿美元)用于AI算力集群。根据修订后的法律,这些投资现在必须登记为国有资产,并接受强制性年度审计。这将放缓采购周期,并有利于提供完整模型溯源文档的供应商。
开源生态:百亿下载里程碑
国内开源模型下载量突破百亿次,主要由Hugging Face中国、ModelScope(阿里巴巴)和OpenI(北京智源人工智能研究院)等平台驱动。下载量最高的模型包括:
- Qwen系列(阿里巴巴):涵盖从0.5B到72B参数的多个版本,在企业应用中占据主导地位。
- ChatGLM系列(THUDM):其6B参数版本是GitHub上最受欢迎的中文模型。
- Yi系列(01.AI):由李开复创立,在34B参数级别上提供了强大的性能。
百亿下载量不仅是一个数字,更标志着中国已建立起一个独立于西方生态系统的自给自足的开源AI生态系统。这一趋势将因新的国资法而进一步加速,因为国有企业需要可审计的模型,而开源模型天然满足这一要求。