华为120亿美元AI芯片雄心,拷问中国晶圆制造产能极限

Hacker News May 2026
来源:Hacker News归档:May 2026
华为预测2025年AI芯片营收将达120亿美元,意图在英伟达被迫退出中国市场后强势填补空白。然而,公司正面临关键瓶颈:国内能生产先进制程的晶圆代工厂已满负荷运转,订单积压与交付延迟正威胁整个国产AI供应链。

华为今年预计实现120亿美元AI芯片营收,这标志着其战略宣言:填补英伟达退出中国市场后留下的真空。华为的昇腾系列处理器,尤其是昇腾910B及即将推出的910C,在大模型训练与推理任务中展现出具有竞争力的性能,缩小了与英伟达A100和H100的差距。然而,真正的制约并非设计能力,而是制造产能。中国最先进的代工厂中芯国际(SMIC)仅能生产N+2(约7nm级)制程芯片,其产能已被华为自身订单及主要云服务商的订单完全占满。每一片晶圆的分配决策都会波及整个AI产业——从视频生成模型到自主智能体。

技术深度解析

华为昇腾系列处理器基于达芬奇架构,其核心是一个统一、可扩展的计算单元——Cube。每个Cube包含16个AI核心,架构通过在芯片上平铺多个Cube实现扩展。当前旗舰产品昇腾910B提供256 TFLOPS的FP16算力和512 TFLOPS的INT8性能,配备32 GB HBM2e内存,带宽达1.2 TB/s。即将推出的昇腾910C预计将采用HBM3,使内存带宽翻倍至2.4 TB/s,并通过更激进的7nm级制程提升计算密度。

然而,制造工艺才是关键瓶颈。中芯国际的N+2制程(相当于台积电7nm节点)因缺乏极紫外(EUV)光刻设备,不得不采用深紫外(DUV)光刻加多重图形化技术。这增加了制造复杂度,降低了良率,并限制了每片晶圆可产出的芯片数量。对于昇腾910B(约600 mm²)这样大小的芯片,一片典型的300mm晶圆大约产出80-100颗可用芯片,而台积电制造的同类芯片可达120-150颗。这一良率差距直接转化为更高的单颗芯片成本和受限的供应。

| 制程节点 | 等效台积电节点 | 是否需要EUV? | 预估良率(600mm²芯片) | 每片晶圆成本(预估) |
|---|---|---|---|---|
| 中芯国际 N+1 | 10nm | 否 | 60-70% | 4,500美元 |
| 中芯国际 N+2 | 7nm | 否 | 40-55% | 5,500美元 |
| 中芯国际 N+3(规划中) | 5nm | 是(有限使用) | 20-30%(预估) | 8,000美元以上 |

数据要点: 非EUV制造的良率惩罚十分严重,可用芯片数量比台积电减少30-50%。这直接限制了华为的产能扩展能力,即便需求无限。

华为的软件栈CANN(计算架构神经网络)已针对降低内存带宽压力和提升利用率进行了优化。最新基准测试显示,在CANN 7.0下,昇腾910B在GPT-3规模模型上的训练吞吐量已达到英伟达A100的85%,而一年前仅为65%。在推理方面差距更小,对于Llama 2-70B模型,当批处理大小达到32或更大时,910B已与A100持平。这些改进得益于更好的算子融合、内存池化和自动混合精度调度。

一个相关的开源项目是华为力推的MindSpore框架,旨在替代PyTorch。MindSpore的GitHub仓库已累计超过4000颗星,并支持与昇腾硬件紧密耦合的自动图优化。然而,其生态系统仍然碎片化,许多中国AI初创公司仍倾向于使用PyTorch配合自定义的昇腾后端。

关键玩家与案例研究

该生态系统的主要参与者包括华为(设计方与集成商)、中芯国际(代工厂),以及作为主要客户的中国云服务商和AI初创公司集群。

华为采取了双轨策略:一方面直接向阿里云、腾讯云、百度智能云等云服务商销售芯片,另一方面也在自己的昇腾云服务中部署这些芯片。内部消耗有助于验证性能并消化初期供应,但外部销售才是营收增长的关键。华为的芯片部门海思持续设计架构,但若无中芯国际,便无法实现大规模制造。

中芯国际是中国唯一能生产7nm级芯片的代工厂。其N+2制程产能估计为每月15,000-20,000片晶圆(WPM),其中据称华为占用了70-80%。剩余产能分配给少数其他客户,包括比特大陆(用于加密货币挖矿芯片)和一些汽车AI芯片。中芯国际在上海的新晶圆厂预计将增加10,000 WPM的N+2产能,但最早要到2026年底才能开始量产。

竞争方案: 多家中国AI芯片初创公司试图填补空白,但均未实现量产规模。

| 公司 | 芯片 | 制程节点 | FP16 TFLOPS | 状态 |
|---|---|---|---|---|
| 华为 | 昇腾910B | 中芯国际 N+2 | 256 | 量产中 |
| 寒武纪 | MLU370 | 台积电7nm(库存) | 128 | 供应有限 |
| 壁仞科技 | BR100 | 台积电7nm(库存) | 256 | 预生产 |
| 燧原科技 | T20 | 中芯国际 N+2 | 192 | 样品阶段 |

数据要点: 华为在性能和产量方面均占据绝对领先地位。寒武纪和壁仞科技依赖出口限制前囤积的台积电晶圆,限制了其扩展能力。燧原科技的T20前景可期,但仍在样品阶段,尚无量产时间表。

案例研究:字节跳动 字节跳动为抖音和推荐系统运行着庞大的AI工作负载,是华为最大的客户之一。2025年第一季度,字节跳动下单订购5万颗昇腾910B芯片,用于训练其下一代视频生成模型。由于晶圆短缺,交付延迟了8-12周,迫使字节跳动延长使用其在出口禁令前囤积的英伟达A100芯片。这一案例生动说明了制造瓶颈如何直接传导至下游应用层。

更多来自 Hacker News

Anthropic's ID Mandate: The Dawn of Tiered AI Access ControlAnthropic宣布自7月8日起,用户访问其部分高级AI功能需通过身份验证。这一举措从自愿安全承诺转向强制性访问控制,标志着AI行业在风险管理上迈出关键一步。AINews分析认为,此举将重塑用户隐私、企业合规与AI开放生态之间的平衡,可能两行代码砍掉四成成本:Tokoscope 让大模型 Token 压缩自动化无节制 AI 开支的时代或许正在终结。AINews 获悉,Tokoscope 是一款轻量级中间件,可自动压缩大语言模型调用中的 Token 用量,早期测试显示成本降低高达 40%,且不牺牲输出质量。该工具仅需两行代码即可集成——一行包装 A本地LLM硬件计算器:架起AI软件与消费级硬件的桥梁“本地LLM硬件计算器”已成为开源AI生态系统中一个意想不到但至关重要的实用工具。其核心功能出奇地简单:用户输入自己的硬件规格——GPU型号、显存、系统内存和CPU——该工具便会将这些信息与Llama 3、Mistral、Qwen、Gemm查看来源专题页Hacker News 已收录 5011 篇文章

时间归档

May 20263028 篇已发布文章

延伸阅读

英伟达认输:美国制裁反噬,华为接管中国AI芯片市场英伟达CEO黄仁勋公开承认,公司已“基本放弃”中国AI芯片市场,将领导地位拱手让给华为。这标志着全球AI计算生态正裂解为两套不兼容的标准,超过60%的中国新建AI数据中心已转向国产芯片。两行代码砍掉四成成本:Tokoscope 让大模型 Token 压缩自动化AINews 独家发现 Tokoscope——仅需两行代码即可自动压缩 LLM Token 用量并实时监控成本。它通过动态剔除冗余 Token 并展示实时成本仪表盘,直击大规模推理的隐性开支,有望让优化民主化,倒逼 API 提供商重新思考定本地LLM硬件计算器:架起AI软件与消费级硬件的桥梁一款名为“本地LLM硬件计算器”的新兴网络工具正迅速走红,它让用户在下载大型语言模型前就能检测自己的PC能否运行。这个看似简单的工具,揭示了强大的开源AI模型与消费级硬件之间日益扩大的鸿沟,标志着AI部署策略正在发生关键转变。AI教AI:递归式智能体课程开启教育新纪元一门名为《智能体系统》的全新开源课程,以激进的前提问世:整个课程的设计、编码与授课均由AI编码智能体独立完成。这种递归式的“AI教AI”方法,不仅传授构建自主系统的知识,更是一场智能体技术真实能力的现场演示,标志着从静态内容到动态、自适应教

常见问题

这次公司发布“Huawei's $12B AI Chip Ambition Tests China's Fab Capacity Limits”主要讲了什么?

Huawei's projection of $12 billion in AI chip revenue this year marks a strategic declaration that it intends to fill the vacuum left by Nvidia's exit from the Chinese market. The…

从“Huawei Ascend 910B vs Nvidia A100 benchmark comparison”看,这家公司的这次发布为什么值得关注?

Huawei's Ascend series processors are built on a Da Vinci architecture that emphasizes a unified, scalable compute unit called the Cube. Each Cube contains 16 AI cores, and the architecture scales by tiling multiple Cube…

围绕“SMIC N+2 process yield rates 2025”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。