中国AI模型大战：72小时涌入百亿美元，残酷淘汰赛正式打响

中国大语言模型（LLM）领域刚刚经历了一场地震级变革。过去三天内，DeepSeek估值暴涨五倍，达到约150亿美元；StepFun以80亿美元估值完成新一轮融资；Moonshot AI则完成了30亿美元的融资交易。三家公司合计资本流动超过100亿美元，这一数字超过了整个行业2023年的融资总额。但这并非繁荣的庆典——而是一场终极、残酷的筛选机制。

DeepSeek的火箭式崛起是最具说服力的信号。三周前估值还仅约30亿美元的公司，如今已跻身中国AI公司前三强。催化剂是什么？一项推理时计算优化的突破性进展，使其旗舰模型的运行成本降低了40%。

这场资本洪流标志着“价格战”时代的终结——即初创公司主要依靠模型质量基准来吸引风险投资的阶段。如今，竞争转向三个维度：1）企业销售速度，2）用户留存率，3）实际应用场景的落地能力。

技术深度解析

推理效率革命

DeepSeek的估值爆炸源于一项外界鲜有人完全理解的技术突破。该公司开发了一种新颖的混合专家（MoE）架构，结合了定制推理引擎，能够根据输入复杂度动态地将token路由到专门的子网络。这并非Mixtral或GPT-4使用的标准MoE；DeepSeek的创新在于一种“预测性路由”机制，该机制在完整计算开始前，使用轻量级分类器决定激活哪些专家路径。

早期基准测试显示，DeepSeek最新模型在同等质量的密集模型基础上，每个token的浮点运算量（FLOPs）减少了40%。在MMLU-Pro基准测试中，其得分为86.2%，而GPT-4为88.7%，但每token成本仅为0.0008美元，GPT-4则为0.0025美元。对于运行高吞吐量推理工作负载的企业客户而言，这一成本优势具有颠覆性意义。

| 模型 | 参数量（估计） | MMLU-Pro得分 | 每百万token成本 | 推理延迟（平均） |
|---|---|---|---|---|
| DeepSeek（最新） | ~180B（MoE） | 86.2% | $0.80 | 1.2s |
| GPT-4o | ~200B（密集） | 88.7% | $2.50 | 1.8s |
| Claude 3.5 Sonnet | ~175B（密集） | 88.3% | $3.00 | 1.5s |
| Qwen2.5-72B | 72B（密集） | 82.5% | $1.20 | 0.9s |

数据要点： DeepSeek每百万token的成本比GPT-4o低68%，而MMLU-Pro得分仅低2.5个百分点。对于每天处理数百万token的企业而言，规模化后每年可节省超过50万美元。推理延迟优势（1.2秒对1.8秒）对于聊天机器人和代码助手等实时应用也至关重要。

多模态与长上下文突破

StepFun的新模型内部代号“Step-Video-2”，采用级联扩散-Transformer架构，能够以24fps帧率和1080p分辨率处理视频帧。其关键创新在于一种时间注意力机制，可压缩冗余帧，相比现有技术将计算需求降低35%。在VBench基准测试中，Step-Video-2在“时间一致性”指标上得分为0.82，超越了OpenAI的Sora（0.78）和Runway Gen-3（0.75）。

Moonshot AI的百万token上下文窗口则通过Ring Attention与一种新颖的“上下文压缩”层相结合实现，该层在推理过程中修剪冗余token。该模型能够一次性处理《三体》三部曲的全部文本，这是其他商业模型尚未公开演示过的壮举。

关键玩家与案例分析

DeepSeek：成本套利者

DeepSeek于2023年由前Google Brain和Microsoft Research工程师团队创立。其策略始终专注于推理成本降低。该公司的GitHub仓库“deepseek-inference”已获得12,000颗星，是中国维护最活跃的开源推理优化库。该仓库包含其预测性路由算法的实现以及用于MoE计算的定制CUDA内核。

StepFun：多模态挑战者

StepFun由前商汤科技研究员领导，定位为中国版的OpenAI Sora。其产品套件包括用于视频生成的“Step-Video”和用于视频分析的“Step-Understand”。该公司已与三家中国主要视频平台（Bilibili、快手和抖音）达成合作，用于内容审核和自动标签。

Moonshot AI：长上下文专家

Moonshot AI由前百度NLP研究员创立，将所有赌注押在了长上下文推理上。其旗舰产品“Kimi Chat”现已支持百万token，并被中国律师事务所用于合同审查，被金融分析师用于财报分析。该公司声称在50万token的“大海捞针”测试中准确率达到95%，而GPT-4仅为78%。

| 公司 | 核心优势 | 估值（估计） | 关键产品 | GitHub仓库（星数） |
|---|---|---|---|---|
| DeepSeek | 推理效率 | $150亿 | DeepSeek-R1 | deepseek-inference（12k） |
| StepFun | 视频生成 | $80亿 | Step-Video-2 | step-video（4.5k） |
| Moonshot AI | 长上下文 | $30亿 | Kimi Chat | kimi-long-context（2.1k） |

数据要点： 估值与GitHub热度或产品成熟度并非线性相关。DeepSeek的150亿美元估值反映了市场的信念：推理成本是企业AI市场最重要的护城河。StepFun和Moonshot AI尽管拥有更具差异化的产品，但估值较低，表明投资者优先考虑可扩展性而非新颖性。

行业影响与市场动态

价格战的终结

这100亿美元的注入标志着“价格战”的终结——即初创公司主要依靠模型质量基准来吸引风险投资的阶段。如今，竞争转向三个维度：1）企业销售速度，2）用户留存率，3）实际应用场景的落地能力。

时间归档

延伸阅读

常见问题

这起“China's AI Model War: $10 Billion in 72 Hours Signals Brutal Elimination Round”融资事件讲了什么？

The Chinese large language model (LLM) landscape just experienced a seismic shift. Over the past three days, DeepSeek's valuation quintupled to an estimated $15 billion, StepFun se…

从“DeepSeek valuation 2025”看，为什么这笔融资值得关注？

DeepSeek's valuation explosion is rooted in a technical breakthrough that few outside the company fully understand. The company has developed a novel mixture-of-experts (MoE) architecture combined with a custom inference…

这起融资事件在“StepFun video generation benchmark”上释放了什么行业信号？

它通常意味着该赛道正在进入资源加速集聚期，后续值得继续关注团队扩张、产品落地、商业化验证和同类公司跟进。