TOPS军备竞赛终结：车企为何抛弃更大芯片，转向更智能系统

过去五年，汽车行业陷入了一场公开的TOPS（每秒万亿次运算）军备竞赛，芯片制造商和车企将不断攀升的算力数字奉为衡量车辆智能的终极标准。然而，AINews的深入调查发现，这种对更大芯片的痴迷正适得其反。三个核心问题浮出水面：算力错配——一款旗舰级L4芯片被安装在一款永远用不上其全部潜力的量产车上；成本溢出——尖端芯片、热管理和供电系统的溢价被转嫁给消费者，而体验提升却不成比例；生命周期错配——AI芯片的迭代速度是整车开发周期的两倍，导致车辆在上市前就已过时。行业正从“堆算力”转向“拼架构”，域控制器、软件定义硬件和模块化升级成为新趋势。

技术深度解析

TOPS军备竞赛的根本缺陷在于，原始算力并不能很好地反映真实世界的汽车性能。芯片的理论峰值TOPS，是在理想条件下通过稀疏矩阵运算和INT8精度测量得出的，但很少能转化为车辆实时运行复杂感知、规划和控制流水线所需的持续吞吐量。

架构错配问题

现代汽车AI工作负载是异构的：它们需要卷积神经网络（CNN）进行目标检测、Transformer进行融合与预测、循环网络进行时序推理，以及经典控制算法。一颗TOPS很高但内存带宽不足、片上SRAM有限或加速器间数据流效率低下的芯片，会在实际工作负载中遇到瓶颈。例如，NVIDIA的Drive Orin（254 TOPS）采用统一内存架构，带宽为204 GB/s，而Qualcomm的Snapdragon Ride Flex（最高200 TOPS）依赖分布式内存层次结构。在实践中，Orin在生产级感知模型上通常能达到理论峰值的70-80%，而Snapdragon在处理Transformer密集型流水线时，由于内存停顿，性能可能降至50-60%。

域控制器革命

行业的技术解决方案是从分布式ECU架构转向集中式域控制器。域控制器不是让一颗巨型芯片包揽一切，而是将工作负载划分到专门的加速器上：一个ASIC负责传感器处理，一个GPU负责神经推理，一个CPU负责规划，一个MCU负责安全关键功能。这降低了对单颗高TOPS芯片的需求。例如，Tesla的Hardware 3（144 TOPS）采用两颗定制芯片的冗余配置，但其后继者Hardware 4（估计300-400 TOPS）仍然依赖域控制器方法，而非单片式超级芯片。关键在于，域控制器允许车企混合搭配来自不同供应商的计算元件，避免供应商锁定，并支持增量升级。

值得关注的GitHub仓库

- autowarefoundation/autoware（12k+星标）：领先的开源自动驾驶栈，现已支持域控制器架构。最近的提交显示其在异构计算单元上进行动态工作负载调度的工作，直接解决了TOPS错配问题。
- apolloauto/apollo（25k+星标）：百度开源平台已转向模块化计算模型，为感知、预测和规划分别设置独立容器，允许每个模块在不同硬件层级上运行。
- tier4/pilot-auto（2k+星标）：一个生产就绪的栈，展示了如何通过精细的算法优化，在单颗Orin NX（70 TOPS）上实现L2+功能，证明100+ TOPS往往并非必要。

数据表：真实世界性能 vs. 理论TOPS

| 芯片 | 理论TOPS (INT8) | 持续推理吞吐量 (ResNet-50, fps) | 功耗 (W) | TOPS/W 效率 |
|---|---|---|---|---|
| NVIDIA Drive Orin | 254 | 4,800 | 45 | 5.64 |
| Qualcomm Snapdragon Ride Flex | 200 | 3,200 | 35 | 5.71 |
| Mobileye EyeQ6H | 67 | 2,100 | 20 | 3.35 |
| Tesla Hardware 3 (定制) | 144 | 3,600 | 36 | 4.00 |
| Horizon Robotics Journey 6 | 128 | 3,000 | 30 | 4.27 |

数据要点： TOPS与真实世界吞吐量之间的相关性很弱。Qualcomm的芯片理论TOPS比Orin低21%，但吞吐量却低33%；而Mobileye的EyeQ6H，TOPS仅为Orin的26%，却实现了其44%的吞吐量。这表明架构效率（TOPS/W和内存带宽）比峰值算力更重要。

关键玩家与案例研究

NVIDIA：压力下的TOPS之王

NVIDIA凭借其Drive平台在高端汽车计算市场占据主导地位，拥有最高的TOPS数字。然而，该公司现在正面临阻力。长期合作伙伴BMW最近宣布，将在其下一代Neue Klasse平台上使用Qualcomm的Snapdragon Ride，理由是成本更低，并且能够为L2+功能精确配置算力，而不是为L4过度配置。NVIDIA的回应是Drive Thor（2000 TOPS），但业内人士质疑，在合理的功耗预算内，是否有任何量产车需要如此巨大的算力。NVIDIA面临的风险是，如果车企转向成本更低、效率更高的芯片，其高TOPS策略可能成为一种负担。

Qualcomm：务实的挑战者

Qualcomm将其Snapdragon Ride Flex定位为“刚好够用”的算力解决方案，提供从30 TOPS（基础ADAS）到200 TOPS（高级L2+）的可扩展配置。关键区别在于Flex架构能够在同一芯片上运行数字座舱和ADAS工作负载，从而降低硬件成本和复杂性。Qualcomm已赢得BMW、Mercedes-Benz和General Motors的设计订单，很大程度上是因为其芯片更便宜、更易于集成。

时间归档

延伸阅读

常见问题

这篇关于“The TOPS Arms Race Is Over: Why Carmakers Are Ditching Bigger Chips for Smarter Systems”的文章讲了什么？

For the past five years, the automotive industry has been locked in a public TOPS (trillions of operations per second) arms race, with chipmakers and car manufacturers touting ever…

从“Why carmakers are abandoning high-TOPS chips for L2+ autonomy”看，这件事为什么值得关注？

The fundamental flaw in the TOPS arms race is that raw compute is a poor proxy for real-world automotive performance. A chip’s theoretical peak TOPS, measured under ideal conditions with sparse matrix operations and INT8…

如果想继续追踪“Tesla Hardware 4 modular upgrade path explained”，应该重点看什么？

可以继续查看本文整理的原文链接、相关文章和 AI 分析部分，快速了解事件背景、影响与后续进展。