AMD和英伟达已经宣布其下一代数据中心GPU将采用HBM4技术,而SK海力士希望成为主要供应商。
周五,这家韩国内存巨头宣布已完成HBM4开发,正准备开始大批量生产这些芯片。这一消息推动SK海力士股价上涨7%,这种反应是有充分理由的。
高带宽内存(HBM)已成为英伟达、AMD等公司高端AI加速器的关键组件。英伟达的Rubin系列和AMD的Instinct MI400系列GPU都在今年早些时候预发布,它们依赖内存供应商在2026年发布时能够提供充足的HBM4供应。
这一转变是因为GPU制造商遇到了现有HBM技术的限制,目前的容量上限约为36GB,每个模块的带宽约为1TB/s,使得英伟达B300或AMD MI355X等芯片的总内存带宽约为8TB/s。
随着向HBM4的迁移,带宽将显著提升。在3月的GTC大会上,英伟达透露其Rubin GPU将配备288GB的HBM4,实现13TB/s的总带宽。AMD计划在其即将推出的MI400系列GPU上装载更大容量的内存,这将为其首个机架级系统Helios提供动力。
从AMD 6月份的AI推进活动中我们了解到,这些产品将配备多达432GB的HBM,总带宽接近20TB/s。
SK海力士表示,通过将I/O终端数量增加到2048个(是HBM3e的两倍),有效地将HBM带宽提高了一倍。该公司认为这也将能效提升了40%以上。
虽然服务器中的普通DRAM通常不是主要的能耗来源,但HBM却是。从AMD MI300X的24GB增加到MI325的36GB模块,功耗从250W跃升至每个GPU约1千瓦。
SK海力士表示,除了更多I/O终端和改进的效率外,其芯片还超越了HBM4的JEDEC标准,实现了10Gb/s的运行速度。
三大HBM供应商中哪家最终将供应这些芯片还有待观察。虽然SK海力士在过去几年中赢得了英伟达大部分HBM业务,但三星和美光也在努力将HBM4推向市场。
美光在6月开始向客户提供36GB 12层高HBM4堆栈样品。与SK海力士类似,这些堆栈使用2048位接口,带宽大约是当前HBM3e模块的两倍。这家美国内存供应商预计明年某个时候开始批量生产这些堆栈。
与此同时,对于三星来说,HBM4为赢得英伟达业务提供了新机会。据报道,该供应商在让其HBM3e堆栈通过英伟达Blackwell加速器的验证方面遇到了困难。
Q&A
Q1:HBM4相比HBM3e有什么改进?
A:HBM4将I/O终端数量增加到2048个,是HBM3e的两倍,有效地将带宽提高了一倍,同时能效提升40%以上。SK海力士的HBM4还超越了JEDEC标准,实现了10Gb/s的运行速度。
Q2:下一代GPU对HBM4的需求有多大?
A:英伟达Rubin GPU将配备288GB的HBM4,实现13TB/s总带宽;AMD MI400系列GPU计划装载多达432GB的HBM,总带宽接近20TB/s,相比目前约8TB/s的水平有显著提升。
Q3:HBM4什么时候能大规模量产?
A:SK海力士已完成HBM4开发,正准备大批量生产。美光预计明年开始批量生产HBM4堆栈。这些产品主要服务于2026年发布的下一代数据中心GPU。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。