技术深度解析
美国从针对AI模型转向打击基础设施的战略调整,体现了对AI价值链的深刻理解。现代AI开发的核心依赖于三个相互依存的层级:计算硬件(GPU、TPU、ASIC)、软件框架(训练、推理、编排)和数据管道(采集、整理、存储、传输)。此次黑名单扩展正是针对在每个层级运营的中国企业。
计算硬件层: 美国出口管制已限制NVIDIA的A100、H100,以及最新的H200和B100系列对华出口。然而,华为(Ascend 910B)、寒武纪(MLU370)和壁仞科技(BR100)等中国企业已开发出替代产品。此次黑名单进一步将先进封装企业(如长电科技、通富微电)和半导体制造设备企业(如北方华创、中微公司)纳入其中。这是对中国本土生产具有竞争力AI芯片能力的直接打击。
软件框架层: 黑名单中包括开发AI训练框架和推理优化工具的公司。DeepSeek在此处的豁免值得注意——其开源模型权重(如DeepSeek-V2、DeepSeek-R1)已被广泛采用,但该公司并不控制PyTorch或TensorFlow等底层框架。然而,中国的替代方案如PaddlePaddle(百度)、MindSpore(华为)和OneFlow(一流科技,现并入智谱AI)正在获得市场认可。黑名单瞄准的是那些可能构建独立于美国控制基础设施的闭环中国AI软件栈的企业。
数据管道层: 这是最容易被忽视但至关重要的维度。黑名单现在包括涉及数据中心运营、云计算服务和跨境数据传输的公司。阿里云、腾讯云和华为云已受到密切关注,而新的认定范围扩展到了更小的数据中心运营商和光纤电缆公司。其目标是阻止中国AI公司从全球来源获取高质量训练数据,或利用国际数据中心进行模型训练。
开源的影响: DeepSeek的开源策略是一把双刃剑。一方面,它加速了全球AI研究和应用。另一方面,它使DeepSeek对美国主导地位的直接威胁降低,因为其模型运行在仍受美国控制的硬件上。然而,开源生态系统制造了一种依赖关系:如果DeepSeek的模型成为中国AI应用的事实标准,而这些应用开始驱动对中国设计芯片的需求,美国可能会失去对硬件-软件协同优化循环的控制。
| 层级 | 美国控制机制 | 中国对应方 | 黑名单状态 |
|---|---|---|---|
| 计算硬件 | 对NVIDIA/AMD GPU的出口管制 | 华为昇腾、寒武纪、壁仞 | 重点打击 |
| 先进封装 | 设备限制 | 长电科技、通富微电、华天科技 | 新列入 |
| AI框架 | 开源(PyTorch、JAX) | PaddlePaddle、MindSpore、OneFlow | 选择性打击 |
| 云基础设施 | 数据中心访问控制 | 阿里云、腾讯云、华为云 | 覆盖范围扩大 |
| 模型权重 | 允许开放分发 | DeepSeek、Qwen、Yi、ChatGLM | 目前豁免 |
数据要点: 美国正在系统性地封锁AI栈的每一层,唯独模型权重除外——因为一旦开源,模型权重本身就难以控制。这表明美国押注于:控制硬件和数据最终将比禁止特定模型更有效地限制模型开发。
关键玩家与案例研究
DeepSeek(杭州): 该公司的豁免是此次政策转变中最受关注的部分。DeepSeek专注于高效模型架构(混合专家模型、多头潜在注意力),以更少的参数实现具有竞争力的性能。其DeepSeek-V2模型总参数为236B,但每个token仅激活21B,展示了一种计算高效的方法。这种效率降低了对最先进芯片的依赖,使其成为不那么紧迫的目标。然而,DeepSeek最近开源发布的DeepSeek-R1——一个与OpenAI o1相媲美的推理模型——提升了其知名度。公司创始人梁文锋公开表示,DeepSeek的目标是让AI访问民主化,这与开源精神一致,但也使其更难被控制。
华为: 黑名单扩展直接针对华为的AI雄心。该公司的昇腾910B芯片虽然在原始性能上无法与NVIDIA H100匹敌,但已被包括百度和腾讯在内的中国主要AI实验室采用。华为的MindSpore框架及其云服务(华为云)构建了一个垂直整合的AI栈,美国将其视为直接威胁。黑名单现在涵盖了参与芯片设计(海思)、软件(华为技术)的子公司。