黄仁勋首尔闪电战:锁定HBM4、密会游戏巨头、引爆韩股熔断

June 2026
NvidiaAI memoryworld model归档:June 2026
英伟达CEO黄仁勋为期四天的首尔之行,不仅与SK海力士敲定了下一代HBM4的早期合作,还秘密会晤了韩国顶级游戏开发商,探讨AI原生引擎。行程尾声,韩国股市因科技股暴跌触发熔断。AINews深度解析这场硬件锁仓与消费端AI转向背后的战略棋局。

黄仁勋的首尔行程绝非一次常规商务访问。英伟达CEO的首要目标是锁定HBM4的供应链——这种高带宽内存将驱动下一代AI训练集群。通过与SK海力士签署早期合作协议,黄仁勋实际上是在押注一个战略判断:在未来两到三年内,“内存墙”(即计算密度与内存带宽之间日益扩大的鸿沟)将成为扩展大语言模型和世界模型的最大瓶颈。这并非一笔采购交易,而是一场先发制人的供应链占领。

但此次行程还有第二条同样耐人寻味的线索。黄仁勋与韩国头部游戏工作室(包括Krafton和Nexon)的高管举行了未公开的会晤。议程并非关于将现有游戏移植到新硬件,而是探讨如何构建“AI原生”游戏引擎——一种将大型神经网络作为核心运行时组件的引擎,能够实时模拟物理、生成叙事并驱动非玩家角色(NPC)。这标志着英伟达正从“为游戏提供GPU”转向“为AI定义游戏”。

然而,这场技术攻势在韩国资本市场引发了连锁反应。黄仁勋到访期间,韩国综合股价指数(KOSPI)因科技股(尤其是三星和SK海力士)的恐慌性抛售而触发熔断。市场将HBM4合作解读为SK海力士对三星的决定性胜利,引发了对三星HBM技术路线图的广泛质疑。讽刺的是,英伟达的胜利反而加剧了其最大供应商所在市场的波动。

技术深度解析

内存墙与HBM4架构

黄仁勋要解决的核心技术挑战是“内存墙”。随着AI模型从数千亿参数扩展到数万亿参数,矩阵乘法的算术强度呈指数级增长。然而,内存带宽——数据在计算单元与内存之间传输的速度——并未同步提升。HBM(高带宽内存)一直是连接两者的桥梁,它通过垂直堆叠DRAM芯片并使用硅中介层连接。目前用于英伟达H200和B200 GPU的HBM3e,每堆叠可提供高达1.2 TB/s的带宽。但对于下一代模型(如GPT-5规模或Google Gemini Ultra 2),这远远不够。

预计于2026年量产的HBM4,将通过增加内存层数并将接口宽度扩展至2048位,将每堆叠带宽提升至2 TB/s以上。更关键的是,HBM4引入了物理集成模式的转变。SK海力士正在开发“定制化HBM4”,其基础芯片(控制内存的逻辑层)可与英伟达的GPU架构协同设计。这使得英伟达能够将自己的缓存一致性协议和内存控制器直接嵌入HBM堆叠中,相比当前的标准方案,延迟预计降低30-40%。

| 内存代际 | 每堆叠带宽 | 每堆叠容量 | 接口宽度 | 预计量产时间 | 关键创新 |
|---|---|---|---|---|---|
| HBM3e | 1.2 TB/s | 24 GB | 1024位 | 2024年 | 8层堆叠,改进散热 |
| HBM4 | 2.0+ TB/s | 48 GB | 2048位 | 2026年 | 定制化基础芯片,与GPU协同设计 |
| HBM4e(预测) | 3.0+ TB/s | 64 GB | 2048位 | 2027年 | 混合键合,16层堆叠 |

数据要点: 从HBM3e到HBM4,带宽提升近70%,但真正的变革在于定制化基础芯片。这使得英伟达能够将内存视为其计算架构的延伸,而非独立的商品。依赖标准HBM的竞争对手(如AMD和英特尔)将在延迟上处于劣势。

实时世界模型与AI原生游戏引擎

黄仁勋与韩国游戏工作室的秘密会晤指向了另一个技术前沿:实时世界模型。世界模型是一种学习环境物理特性、动态变化和规则的神经网络。在游戏中,这意味着用能够实时感知、规划并行动的AI智能体取代脚本化的NPC行为。挑战在于,当前的游戏引擎(Unreal Engine 5、Unity)基于确定性的、手工编写的逻辑构建。而AI原生引擎必须以60帧/秒的速度运行大型神经网络,且推理延迟低于10毫秒。

这正是英伟达硬件路线图与软件的交汇点。其TensorRT-LLM推理框架,结合即将推出的Blackwell Ultra GPU(配备专用Transformer引擎),能够提供所需的吞吐量。但真正的创新在于单台服务器内跨多GPU的分布式推理。对于一个拥有100亿参数的世界模型,单个GPU无法同时处理内存占用和计算负载。英伟达的NVLink 5.0可在单个域内连接多达576个GPU,允许模型跨设备分片,每个GPU处理环境状态的一部分。

该领域一个值得注意的开源项目是英伟达自家的'GameGAN'(已被内部研究取代),但社区已围绕'Genesis'(GitHub: Genesis-Embodied-AI/Genesis)集结,这是一个嵌入物理的世界模型框架,2025年在GitHub上获得了12000颗星。Genesis使用可微分物理引擎来训练能够实时模拟刚体动力学、流体流动甚至软体变形的世界模型。虽然尚未达到游戏就绪状态,但它证明了神经模拟的可行性。

关键参与者与案例研究

SK海力士 vs. 三星 vs. 美光:HBM4竞赛

HBM4协议不仅关乎英伟达;它也是SK海力士的一场战略胜利。该公司一直是HBM3和HBM3e的主要供应商,2025年估计占据53%的市场份额。三星尽管拥有庞大的DRAM产能,但在HBM3e产品上一直受困于散热和良率问题,错过了与英伟达的关键认证周期。美光虽然技术上具有竞争力,但缺乏成为英伟达主要供应商所需的产能规模。

| 公司 | HBM3e市场份额(2025年估计) | HBM4时间表 | 关键优势 | 关键风险 |
|---|---|---|---|---|
| SK海力士 | 53% | 2026年第二季度量产 | 与英伟达协同设计的定制化基础芯片 | 过度依赖单一客户(英伟达约占其营收的40%) |
| 三星 | 38% | 2026年第三季度量产 | 垂直整合(DRAM + 逻辑晶圆厂) | HBM3e良率问题,认证延迟 |
| 美光 | 9% | 2027年第一季度量产 | 每比特功耗更低 | 产能有限,入市较晚 |

数据要点: SK海力士在HBM4上提前锁定英伟达,是一项防御性举措。

相关专题

Nvidia41 篇相关文章AI memory37 篇相关文章world model74 篇相关文章

时间归档

June 2026755 篇已发布文章

延伸阅读

黄仁勋AI峰会:规划从大语言模型到具身世界模型的发展路径NVIDIA创始人黄仁勋近期召集全球最具潜力的AI初创公司CEO举行里程碑式论坛。这场对话标志着行业轨迹的明确转向——超越大语言模型竞争时代,迈向对系统性具身智能的统一追求。英伟达的Anthropic豪赌:黄仁勋的直供AI战略能否击败云巨头?英伟达CEO黄仁勋已向传统云模式宣战,将公司定位为AWS、Azure和Google Cloud的直接竞争者,而非供应商。本文剖析英伟达以与Anthropic深度合作为锚点的激进战略转向,并评估其CUDA生态能否抵挡住全球最大科技公司的反击。黄仁勋的蓝图:加速计算如何筑起4万亿美元AI帝国英伟达市值突破4万亿美元,这不仅是资本市场的奇迹,更是一场历时十年、精心布局的架构性胜利。CEO黄仁勋提出的“加速计算”与“数据中心即计算机”愿景,已使公司成为生成式AI革命的基石层,其雄心正延伸至AI工厂与自主机器人领域。触觉即第二视觉:千觉机器人如何重新定义具身智能千觉机器人正引领一场具身智能的范式革命——将触觉感知视为核心认知模态,而非单纯的附加功能。高分辨率触觉传感器与学习模型相结合,使机器人能够感知硬度、纹理与形变,从而解锁从草莓采摘到精密手术组装等一系列高精度任务。

常见问题

这次公司发布“Jensen Huang's Seoul Blitz: HBM4 Deals, Gaming Pivot, and Market Chaos”主要讲了什么?

Jensen Huang's Seoul itinerary was anything but routine. The Nvidia CEO's primary objective was to lock down the supply chain for HBM4, the high-bandwidth memory that will power th…

从“Nvidia HBM4 SK Hynix deal details”看,这家公司的这次发布为什么值得关注?

The core technical challenge Huang is addressing is the 'memory wall.' As AI models scale from hundreds of billions to trillions of parameters, the arithmetic intensity of matrix multiplications has grown exponentially.…

围绕“Jensen Huang Korea game studio meeting”,这次发布可能带来哪些后续影响?

后续通常要继续观察用户增长、产品渗透率、生态合作、竞品应对以及资本市场和开发者社区的反馈。