英伟达首次推出配备高速内存的升级版GH200 Grace Hopper芯片

英伟达今天首次推出了GH200 Grace Hopper芯片的升级版，它将使企业能够运行更复杂的语言模型。

作者：MARIA DEUTSCHER

更新时间：美国东部时间2023年8月8日15:56

英伟达（Nvidia Corp.）今天首次推出了GH200 Grace Hopper芯片的升级版，它将使企业能够运行更复杂的语言模型。

英伟达的首席执行官黄仁勋（Jensen Huang）在本周于拉斯维加斯举行的Siggraph计算机图形大会的主题演讲中详细介绍了这款芯片。黄仁勋表示，GH200（如图）目前正在生产中。英伟达计划在今年年底开始提供该芯片的样品，并预计在2024年下半年开始在服务器上使用。

英伟达表示，新版GH200是全球首款包含HBM3e内存的处理器。这是一种高速内存，用于存储芯片正在处理的数据。它比HBM3（原版GH200使用的技术）快50%。

HBM3e是SK hynix公司采用10纳米工艺制造的。英伟达采用该技术不算意外。今年6月，有报道称该芯片巨头曾向SK hynix购买HBM3e样品。

为芯片配备HBM3e之类更快的内存能使其以更高的性能运行大型语言模型。这与语言模型和一般神经网络的架构方式有关。

人工智能由许多称为层的软件构件组成。每个构件执行用户分配给人工智能的一小部分任务。

人工智能的第一层将原始数据作为输入，对其进行分析并生成一系列中间结果。然后，这些结果被传送到第二层，由第二层进行进一步处理。然后，进一步处理的结果会被发送到第三层进行新一轮计算，同样的过程会重复多次。

每当人工智能的某一层产生中间处理结果时，运行人工智能的芯片就必须将这些结果保存到内存中。然后，这些数据必须从内存中取出，进入下一个人工智能层进行进一步分析。这意味着数据要在芯片的逻辑电路和内存之间不断移动。

英伟达升级版GH200芯片中的HBM3e内存让数据能够以比以往更快的速度进出逻辑电路，从而加快了处理速度。据英伟达表示，这种性能提升将使企业能够运行更先进的人工智能模型。这家芯片制造商表示，一台配备两块新GH200芯片的服务器可运行的人工智能模型比使用原版GH200类似配置系统的规模大3.5倍。

新型GH200可在两个板载计算模块上运行人工智能模型。第一个是基于Arm的Neoverse芯片设计的中央处理单元，拥有72个内核。GH200的另一个计算模块则是一个图形处理单元，可提供4 PB的AI性能。

在今天的Siggraph大会上，黄仁勋介绍称GH200的设计是内存和高速缓存一致。这意味着板载GPU和CPU可以在相同的数据上进行计算，而不是像通常要求的那样使用单独的数据副本。据英伟达称，这种做法提高了处理效率。

黄仁勋表示：“你可以将任何大型语言模型放入GPU，它就会疯狂地进行推理。”“大型语言模型的推理成本将大幅下降。”

GH200兼容英伟达的MGX参考架构，后者是一种设计服务器的蓝图。因此，硬件制造商将该芯片集成到基于MXP的服务器中应该比较简单。

黄仁勋表示，升级之后配备HBM3的GH200还构成了名为Grace Hopper Compute Tray的数据中心系统的基础。该系统都将单个GH200与英伟达的BlueField-3和ConnectX-7芯片结合在一起。后两种芯片的设计目标都是为了加快服务器之间的网络流量，但是BlueField-3也可以加速某些其他计算任务。

单个集群最多可连接256个Grace Hopper Compute Trays。据黄仁勋表示，这样一个集群可以提供1 exaflop的人工智能性能。1 exaflop相当于每秒百亿亿次计算。

来源：至顶网计算频道

0赞

好文章，需要你的鼓励

英伟达首次推出配备高速内存的升级版GH200 Grace Hopper芯片

来源：至顶网计算频道

2023

08/09

10:30

分享

点赞

AI工厂引领产业变革：芯片巨头如何重塑计算基础设施

谷歌法庭文件承认开放网络正"快速衰落"

d-Matrix推出IO加速器，宣称AI推理延迟将达到全新低点

Vidu推出参考图转图功能，用生成式AI重塑摄影创作

SiFive推出面向AI设备的全新处理器核心设计

神经形态计算与边缘AI的未来发展

CIO未来职业发展的五个关键策略

无技术学位转行网络安全：实用指南

IDC发布乐观AI支出预测：2029年将达1.3万亿美元

Cloudera：企业如何掌控专有数据

宏碁Aspire 14 AI：500美元实现专业级AI性能

博通获得100亿美元AI芯片新订单，股价创历史新高

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

专访DeepMind CEO：我们距离实现AGI只需5-10年

企业AI是确定性的长期主义

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: