技术深度解析
从算力优先到基础设施优先的AI转型,根植于根本性的架构分歧。以DeepSeek V4为例,它放弃了将参数规模扩展到1万亿以上的趋势,转而采用混合专家(MoE)架构:总参数6700亿,但每个token仅激活370亿参数。这一设计受Google GLaM启发,并由DeepSeek自身研究优化,以比GPT-4低40%的推理成本实现了同等水平的推理能力。其关键创新在于一种动态路由机制,该机制能根据任务上下文(而非静态规则)学习将token分配给最相关的专家,从而缓解了密集模型普遍面临的内存带宽瓶颈。
在GitHub上,开源社区已围绕效率展开行动。仓库'llama.cpp'(超过7万星标)现已支持DeepSeek V4的MoE架构,使其能在RTX 4090等消费级硬件上进行本地推理。同时,'vLLM'(超过4万星标)集成了针对稀疏MoE层的自定义CUDA内核,相比标准实现实现了2.3倍的吞吐量提升。这些工具对于在边缘设备(如仓库机器人或配送无人机)上部署AI至关重要——这些场景对延迟和功耗有严格限制。
美团的LongCat则采取了不同路径。它基于Transformer世界模型构建,能够吸收多模态数据:GPS轨迹、摄像头画面、加速度计读数以及订单时间戳。该模型不生成文本,而是为超过1万架自主配送无人机和5000个机器人厨房输出控制信号。LongCat采用分层规划架构:高层策略网络预测最优路线和任务序列,而低层控制器则处理实时避障与操作。这本质上是美团物理物流网络的数字孪生,基于PB级真实运营数据训练而成。
| 模型 | 参数规模 | 每Token激活参数 | 推理成本(每百万Token) | 边缘设备延迟 |
|---|---|---|---|---|
| GPT-4 | ~1.7万亿(估计) | ~1.7万亿 | $10.00 | 800ms |
| DeepSeek V4 | 6700亿 | 370亿 | $3.50 | 120ms |
| LongCat(专有) | 1200亿 | 1200亿 | $1.20(内部) | 45ms |
数据要点: DeepSeek V4相比GPT-4实现了65%的成本降低,同时保持了有竞争力的推理能力。LongCat针对边缘优化的延迟(45ms)对于实时无人机控制至关重要——而GPT-4的800ms延迟在此领域完全不可用。
关键玩家与案例研究
DeepSeek(中国): DeepSeek V4是其MoE系列的第四代产品。该公司将自己定位为“效率冠军”,发布的模型在性能上匹配或超越OpenAI,而计算成本仅为后者的一小部分。其策略是将模型授权给硬件制造商(如Qualcomm、MediaTek)用于设备端部署,从而绕过困扰美国AI公司的云依赖。
美团(中国): 这家外卖巨头运营着全球最大的即时配送网络——日均订单超过700万。LongCat并非可下载的产品,而是一个控制其整个物理基础设施的内部系统。美团已在30个城市部署该模型用于无人机配送,将平均配送时间从38分钟缩短至12分钟。其“AI厨房”计划利用LongCat协调机械臂、烤箱和包装机,每平方米吞吐量比人工厨房高出40%。
美国“三巨头”(匿名): 三家领先的美国AI公司(普遍认为是OpenAI、Google DeepMind和Anthropic)目前正大力投资物理基础设施。其中一家已与美国某大型物流公司合作,构建其供应链的“数字孪生”;另一家正在开发专有的机器人操作系统。然而,它们面临结构性劣势:缺乏美团等中国公司多年来在真实部署中积累的运营数据。
| 公司 | 物理资产 | 用于物理控制的AI模型 | 部署规模 |
|---|---|---|---|
| 美团 | 1万架无人机、5000个机器人厨房、100万+配送员 | LongCat | 30个城市、日均700万订单 |
| 美国公司A | 500个仓库机器人(租赁) | 内部'LogiGPT'(未发布) | 5个试点仓库 |
| 美国公司B | 200辆自动驾驶汽车(原型) | 'DriveNet'(未发布) | 2个测试城市 |
数据要点: 中国公司在物理部署规模上拥有10到100倍的优势。这一数据护城河是自我强化的:更多部署产生更多数据,数据改进AI,AI又推动更多部署。
行业影响与市场动态
市场已开始为这一转变定价。根据PitchBook数据,2026年第一季度,“AI+物理基础设施”初创公司的风险投资达到128亿美元,同比增长340%。同期,纯AI模型公司(无物理资产)的估值平均下跌22%。