技术深度剖析
监管行动与AI资本部署的交汇揭示了深层技术暗流。SAMR对14家外卖平台(包括美团、饿了么及小型玩家)的检查并非简单的合规审查。它直指这些平台的算法核心:实时路径规划、动态定价及配送时间优化系统——这些系统优先考虑速度而非安全。这些算法通常基于强化学习框架构建,例如开源库`stable-baselines3`(GitHub上超过8000星),优化指标包括平均配送时间和订单吞吐量。然而,它们产生了二阶效应:商户在时间压力下偷工减料,配送员面临绕过质量检查的激励。监管机构的行动标志着从被动执法向主动算法审计的转变,我们预计这一趋势将在全球范围内复制。
在AI前沿,Alphabet的847.5亿美元融资轮直接回应了Gemini 3.5 Pro的计算需求。该模型预计采用混合专家(MoE)架构的多模态设计,类似于开源模型`Mixtral 8x22B`(GitHub上超过40000星),但规模扩展至估计1.5万亿参数。其关键创新可能在于实时世界建模能力——一种允许模型维护物理环境动态内部表征的技术,可实现机器人操作和自主导航等任务。这需要巨大的推理时计算量,因为每次前向传播必须同时处理视频、音频和传感器数据流。Alphabet增加的融资很可能用于确保TPU v5集群和扩展数据中心容量,估计Gemini 3.5 Pro将需要其前身10倍的计算量。
DeepSeek据报以590亿美元估值完成70亿美元融资同样意味深长。该公司的开源模型DeepSeek-V2在MMLU(85.2)和HumanEval(74.6)等基准测试中表现出竞争力,但其真正优势在于高效的MoE架构,与密集模型相比推理成本降低40%。这笔资金很可能用于开发DeepSeek-V3,目标是在保持成本效率的同时达到GPT-4o级别的推理能力。下表比较了当前格局中的关键模型:
| 模型 | 参数(估计) | MMLU分数 | HumanEval分数 | 成本/100万token(输入) |
|---|---|---|---|---|
| GPT-4o | ~200B(密集) | 88.7 | 87.1 | $5.00 |
| Gemini 3.5 Pro(估计) | ~1.5T(MoE) | 90.2(预测) | 89.5(预测) | $8.00 |
| DeepSeek-V2 | ~236B(MoE) | 85.2 | 74.6 | $0.48 |
| Claude 3.5 Sonnet | — | 88.3 | 84.9 | $3.00 |
数据要点: DeepSeek的成本优势极为显著——推理成本仅为GPT-4o的十分之一,而MMLU差距仅3.5分,对专有模型构成严重威胁。然而,Gemini 3.5 Pro的预测性能飞跃表明Alphabet押注于规模而非效率。
关键玩家与案例研究
比亚迪进入人形机器人领域是一项战略妙举,充分利用了其核心能力。该公司的制造实力——2025年生产超过300万辆汽车——为其提供了无与伦比的精密组件供应链,如电机、传感器和电池。比亚迪的人形机器人内部代号为“先锋”,预计将使用与其电动汽车相同的刀片电池技术,提供8小时以上的连续运行时间。机器人的AI堆栈很可能基于比亚迪内部自动驾驶平台DiPilot构建,该平台已处理感知和路径规划。这种汽车与机器人AI的交叉融合在开源库`robosuite`(GitHub上超过4000星)中显而易见,该库提供机器人操作任务的模拟环境——比亚迪工程师很可能正在为工业用例调整这些工具。
两家加入沪深港通计划的中国自动驾驶公司——小马智行(Pony.ai)和文远知行(WeRide)——代表了AI驱动出行的下一波浪潮。小马智行的机器人出租车车队在北京和广州已累计行驶超过1000万英里,而文远知行专注于自动驾驶巴士和环卫车辆。它们被纳入沪深港通计划允许内地投资者交易这些港股,可能释放20-30亿美元的新资本。这是一个关键的生命线,因为两家公司每年烧钱速度超过5亿美元。
DeepSeek的融资轮如果得到确认,将在估值方面超越OpenAI在2023年从微软获得的100亿美元融资(当时OpenAI估值为290亿美元)。关键区别在于:DeepSeek是一家在先进芯片出口管制下运营的中国公司。为规避这一限制,DeepSeek开发了使用华为昇腾910B芯片的自定义训练技术,实现了NVIDIA H100 80%的吞吐量。这一变通方案展示了中国AI公司在硬件限制下的创新能力,但也凸显了其面临的持续挑战。