AI下一阶段：物理基础设施为何比算力更重要

在与三家美国领先AI公司的核心团队进行深入对话后，AINews发现了一个决定性转变：由原始算力驱动的AI竞争第一阶段已经结束。新阶段以“物理扎根”为特征——即AI系统与现实世界基础设施交互并控制它们的能力。DeepSeek V4的发布不仅仅是一次模型更新，更是一次战略调整：从参数膨胀转向推理效率与边缘智能。与此同时，美团的LongCat模型并非聊天机器人，而是一个为无人机配送、自动厨房和城市交通网络设计的“物理大脑”。这印证了一个日益增长的共识：未来的AI领导者必须同时拥有数字智能与物理资产。当美国巨头们争相追赶时，中国公司已在部署规模上建立起10到100倍的优势。

技术深度解析

从算力优先到基础设施优先的AI转型，根植于根本性的架构分歧。以DeepSeek V4为例，它放弃了将参数规模扩展到1万亿以上的趋势，转而采用混合专家（MoE）架构：总参数6700亿，但每个token仅激活370亿参数。这一设计受Google GLaM启发，并由DeepSeek自身研究优化，以比GPT-4低40%的推理成本实现了同等水平的推理能力。其关键创新在于一种动态路由机制，该机制能根据任务上下文（而非静态规则）学习将token分配给最相关的专家，从而缓解了密集模型普遍面临的内存带宽瓶颈。

在GitHub上，开源社区已围绕效率展开行动。仓库'llama.cpp'（超过7万星标）现已支持DeepSeek V4的MoE架构，使其能在RTX 4090等消费级硬件上进行本地推理。同时，'vLLM'（超过4万星标）集成了针对稀疏MoE层的自定义CUDA内核，相比标准实现实现了2.3倍的吞吐量提升。这些工具对于在边缘设备（如仓库机器人或配送无人机）上部署AI至关重要——这些场景对延迟和功耗有严格限制。

美团的LongCat则采取了不同路径。它基于Transformer世界模型构建，能够吸收多模态数据：GPS轨迹、摄像头画面、加速度计读数以及订单时间戳。该模型不生成文本，而是为超过1万架自主配送无人机和5000个机器人厨房输出控制信号。LongCat采用分层规划架构：高层策略网络预测最优路线和任务序列，而低层控制器则处理实时避障与操作。这本质上是美团物理物流网络的数字孪生，基于PB级真实运营数据训练而成。

| 模型 | 参数规模 | 每Token激活参数 | 推理成本（每百万Token） | 边缘设备延迟 |
|---|---|---|---|---|
| GPT-4 | ~1.7万亿（估计） | ~1.7万亿 | $10.00 | 800ms |
| DeepSeek V4 | 6700亿 | 370亿 | $3.50 | 120ms |
| LongCat（专有） | 1200亿 | 1200亿 | $1.20（内部） | 45ms |

数据要点： DeepSeek V4相比GPT-4实现了65%的成本降低，同时保持了有竞争力的推理能力。LongCat针对边缘优化的延迟（45ms）对于实时无人机控制至关重要——而GPT-4的800ms延迟在此领域完全不可用。

关键玩家与案例研究

DeepSeek（中国）： DeepSeek V4是其MoE系列的第四代产品。该公司将自己定位为“效率冠军”，发布的模型在性能上匹配或超越OpenAI，而计算成本仅为后者的一小部分。其策略是将模型授权给硬件制造商（如Qualcomm、MediaTek）用于设备端部署，从而绕过困扰美国AI公司的云依赖。

美团（中国）： 这家外卖巨头运营着全球最大的即时配送网络——日均订单超过700万。LongCat并非可下载的产品，而是一个控制其整个物理基础设施的内部系统。美团已在30个城市部署该模型用于无人机配送，将平均配送时间从38分钟缩短至12分钟。其“AI厨房”计划利用LongCat协调机械臂、烤箱和包装机，每平方米吞吐量比人工厨房高出40%。

美国“三巨头”（匿名）： 三家领先的美国AI公司（普遍认为是OpenAI、Google DeepMind和Anthropic）目前正大力投资物理基础设施。其中一家已与美国某大型物流公司合作，构建其供应链的“数字孪生”；另一家正在开发专有的机器人操作系统。然而，它们面临结构性劣势：缺乏美团等中国公司多年来在真实部署中积累的运营数据。

| 公司 | 物理资产 | 用于物理控制的AI模型 | 部署规模 |
|---|---|---|---|
| 美团 | 1万架无人机、5000个机器人厨房、100万+配送员 | LongCat | 30个城市、日均700万订单 |
| 美国公司A | 500个仓库机器人（租赁） | 内部'LogiGPT'（未发布） | 5个试点仓库 |
| 美国公司B | 200辆自动驾驶汽车（原型） | 'DriveNet'（未发布） | 2个测试城市 |

数据要点： 中国公司在物理部署规模上拥有10到100倍的优势。这一数据护城河是自我强化的：更多部署产生更多数据，数据改进AI，AI又推动更多部署。

行业影响与市场动态

市场已开始为这一转变定价。根据PitchBook数据，2026年第一季度，“AI+物理基础设施”初创公司的风险投资达到128亿美元，同比增长340%。同期，纯AI模型公司（无物理资产）的估值平均下跌22%。

时间归档

延伸阅读

常见问题

这次公司发布“AI's Next Phase: Why Physical Infrastructure Beats Raw Compute Power”主要讲了什么？

After extensive conversations with core teams at three leading US AI companies, AINews has identified a decisive shift: the first phase of AI competition, driven by raw compute sca…

从“DeepSeek V4 vs GPT-4 inference cost comparison”看，这家公司的这次发布为什么值得关注？

The shift from compute-first to infrastructure-first AI is rooted in a fundamental architectural divergence. DeepSeek V4, for instance, abandons the trend of scaling parameters beyond 1 trillion. Instead, it employs a Mi…

围绕“Meituan LongCat drone delivery failure rate”，这次发布可能带来哪些后续影响？

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。