英伟达联手SK海力士定制HBM,万亿参数AI推理瓶颈如何破?

2026年6月8日,英伟达(NVIDIA)宣布与韩国存储芯片制造商SK海力士(SK Hynix)达成一项多年期技术合作,双方将共同推动“AI工厂”内存架构的革新,重点深化高带宽内存(HBM)与定制化存储解决方案的联合开发,以加速万亿参数规模大模型的推理效率。这一合作标志着全球AI算力基础设施的关键环节——内存子系统——正从通用组件向高度协同、垂直整合的方向演进。
合作聚焦AI推理瓶颈:HBM与定制存储成核心
当前主流AI训练和推理系统面临的核心挑战之一,是处理器与内存之间的“内存墙”问题。随着大语言模型参数量突破万亿级别,传统DRAM架构已难以满足GPU对数据吞吐速度和能效比的严苛要求。
英伟达此次与SK海力士的合作,明确指向下一代HBM技术的协同优化。不同于以往芯片厂商与存储供应商之间相对松散的规格对接,此次合作强调“多年技术合作”与“定制存储开发”,暗示双方将在物理层、接口协议乃至系统级封装(SiP)层面进行深度耦合。这意味着未来的HBM产品可能不再仅是标准化的JEDEC兼容模块,而是针对英伟达Blackwell或后续架构GPU专门设计的异构集成方案。
值得注意的是,合作特别提及“加速万亿参数大模型推理”。这释放出一个重要信号:AI产业重心正从训练阶段向推理阶段迁移。训练虽消耗大量算力,但推理才是模型商业化落地的关键环节,涉及实时响应、成本控制与能效管理。而推理对内存延迟和带宽的敏感度极高,尤其在处理长上下文、多模态输入时。因此,通过定制HBM降低访问延迟、提升有效带宽,可直接转化为更低的单次推理成本和更高的服务吞吐量。
为何是SK海力士?技术协同与产能保障双重逻辑
在全球HBM市场,SK海力士长期处于领先地位。
此次合作并非双方首次互动。这种模式类似于台积电与英伟达在先进制程上的CoWoS封装协同,即供应链关系向技术共生体演进。
对英伟达而言,锁定SK海力士不仅确保了关键内存组件的稳定供应,更能在HBM迭代节奏上掌握主动权。通过与头部厂商提前绑定,英伟达可推动HBM接口、供电、散热等设计向自身GPU架构倾斜,从而构建更高效的端到端AI计算栈。
对SK海力士而言,与英伟达的深度合作则巩固其在AI存储赛道的护城河。在HBM领域,技术领先窗口期有限,一旦落后便可能被竞争对手反超。通过参与英伟达下一代平台定义,SK海力士不仅能获得长期订单保障,还能借助英伟达的系统级反馈优化自身工艺,形成“设计-制造-验证”闭环。
AI工厂范式升级:从芯片堆砌到全栈协同
英伟达近年来反复强调“AI工厂”概念——将数据中心视为生产智能的工厂,其中GPU是引擎,网络是物流系统,而内存则是原材料仓库。此次合作正是对这一范式的具体落实。
定制化HBM的引入,意味着AI工厂的“原材料供应链”将实现精细化管理。例如,针对不同模型结构(如稀疏激活、专家混合MoE),可动态调整内存带宽分配;或通过近存计算(near-memory computing)技术,在HBM堆栈中嵌入简单计算单元,减少数据搬运能耗。这些创新均需存储厂商与芯片设计方在早期阶段紧密协作。
此外,合作还可能延伸至软件栈层面。英伟达的CUDA生态已深度优化内存访问模式,未来或与SK海力士共同开发驱动层或固件接口,使操作系统和AI框架能更智能地调度HBM资源。这种软硬协同将进一步拉开通用方案与定制方案之间的性能差距。
市场影响与竞争格局重塑
该合作对全球半导体产业链将产生深远影响。首先,它加剧了HBM市场的集中化趋势。英伟达与SK海力士的深度绑定,可能迫使其他AI芯片公司加速与剩余供应商的战略合作,甚至催生新的联盟。
其次,定制化路径抬高了新进入者的门槛。初创AI芯片公司若无法获得顶级HBM厂商的技术支持,将难以在性能上与英伟达生态竞争。这进一步强化了英伟达在AI基础设施领域的主导地位。
对投资者而言,此次合作凸显了存储芯片在AI价值链中的战略价值。SK海力士作为HBM龙头,其技术护城河正从制造能力扩展至系统级协同能力,估值逻辑有望从周期性存储厂商向成长型AI基础设施伙伴切换。而英伟达则通过垂直整合巩固其“全栈AI”优势,为未来数年的产品路线图奠定基础。
展望:合作落地仍需跨越工程挑战
尽管合作愿景宏大,实际落地仍面临多重挑战。定制化设计虽能提升性能,但也可能延长开发周期、增加成本。
在全球AI竞赛进入深水区的当下,算力军备竞赛已从单一芯片性能转向全系统效率优化。英伟达与SK海力士的联手,不仅是技术合作,更是对未来AI基础设施架构的一次关键押注——谁掌控了内存与计算的协同边界,谁就掌握了万亿参数智能时代的入场券。












