当前,生成式AI已经成为最具时代性的变革性技术。而在COMPUTEX主题演讲上,NVIDIA创始人兼首席执行官黄仁勋展示了多个新系统、软件及服务,让生成式AI革新广告、制造、电信等行业。
在黄仁勋看来,加速计算和AI标志着计算的革新。“我们现在正处于一个全新计算时代的转折点,加速计算和AI已经被世界上几乎所有的计算和云公司所采用。”
01 DGX GH200 AI超级计算机
生成式AI、大型语言模型和推荐系统等推动算力系统的极致发展。NVIDIA DGX GH200 AI超级计算机就是这样一款产品。
NVIDIA DGX GH200由NVIDIA GH200 Grace Hopper超级芯片和NVIDIA NVLink Switch System驱动,提供1exaflop的性能和144TB的共享内存——相较2020年推出的上一代NVIDIA DGX A100内存大了近500倍。
GH200超级芯片使用NVIDIA NVLink-C2C芯片互连,将基于Arm的NVIDIA Grace CPU与NVIDIA H100 Tensor Core GPU整合在一起,从而不再需要传统的CPU至GPU PCIe连接。与最新的PCIe技术相比,这将GPU和CPU之间的带宽提高了7倍,将互连功耗减少了5倍以上,并为DGX GH200超级计算机提供了一个600GB的Hopper架构GPU构建模块。
DGX GH200是第一款将Grace Hopper超级芯片与NVIDIA NVLink Switch System配对使用的超级计算机,这种新的互连方式使DGX GH200系统中的所有GPU作为一个整体协同运行。上一代系统在不影响性能的前提下只能通过NVLink把8个GPU整合成一个GPU。
DGX GH200架构相比上一代将NVLink带宽提升了48倍以上,实现在单个GPU上通过简单编程即可提供大型AI超级计算机的能力。
在软件堆栈方面,DGX GH200超级计算机支持NVIDIA软件,包括NVIDIA Base Command、NVIDIA AI Enterprise等,可为最大的AI和数据分析工作负载提供一个交钥匙式全栈解决方案。
据悉,谷歌云、Meta和微软是首批有望接入DGX GH200来探索其用于生成式AI工作负载的能力的公司。NVIDIA还打算将DGX GH200设计作为蓝图提供给云服务提供商和其他超大规模企业,以便他们能够进一步根据他们自己的基础设施进行定制。
02 模块化参考架构NVIDIA MGX
为了满足各种规模数据中心的需求,NVIDIA发布了一个用于创建加速服务器的模块化参考架构NVIDIA MGX。系统制造商将使用该架构快速、经济地构建100多种不同的服务器配置,满足各种AI、HPC和NVIDIA Omniverse应用的需求。
MGX与NVIDIA HGX的不同之处在于,它能够灵活地兼容多代NVIDIA产品,确保系统制造商能够重新利用现有设计,并轻松地采用下一代产品,而无需代价高昂的重新设计。相比之下,HGX基于一个通过NVLink连接的多GPU基板,为打造极致的AI和HPC系统而量身定制。
凭借MGX,制造商能够使用通用架构和模块化组件构建CPU和加速服务器。MGX支持NVIDIA全部GPU、CPU、DPU和网络适配器系列,以及各种风冷、液冷机箱的x86和Arm处理器。
ASRock Rack、ASUS、GIGABYTE、Pegatron、QCT和Supermicro将采用MGX,它可将开发成本削减四分之三,并将开发时间缩短三分之二至仅6个月。
比如NVIDIA正在与电信巨头软银合作,在日本建立分布式数据中心网络,为提供新型服务奠定基础。它将在通用云平台上提供5G服务和生成式AI应用程序。
这些数据中心将使用模块化MGX系统中的NVIDIA GH200超级芯片和NVIDIA BlueField-3 DPU以及NVIDIA Spectrum以太网交换机提供5G协议所需的高精度计时。该平台将通过提高频谱效率来降低成本和能耗。
NVIDIA Grace Hopper和NVIDIA BlueField-3 DPU将加速软件定义的5G vRAN以及生成式AI应用,而无需定制硬件加速器或专用5G CPU。此外,配备BlueField-3的NVIDIA Spectrum以太网交换机将为5G提供高精度时间同步协议。
该解决方案在NVIDIA加速的1U MGX服务器设计上实现了突破性的5G速度,根据公开的5G加速器数据,它实现了业内吞吐量最高的36Gbps下行链路容量。
03 NVIDIA Spectrum-X网络平台
生成式 AI 等革命性技术对于数据中心的性能提出了更高的要求,特别是网络性能。NVIDIA Spectrum-X网络平台的目标是提高基于以太网AI云的性能与效率,与现有以太网的堆栈实现互通。
NVIDIA Spectrum-X网络平台步于Spectrum-4 ,这是全球首款专为AI网络打造的51Tb/s以太网交换机。先进的RoCE扩展功能可以跨Spectrum-4交换机、BlueField-3 DPU和NVIDIA LinkX光纤相互协同,共同构建了一个专为AI云优化的端到端400GbE网络。
NVIDIA Spectrum-X通过性能隔离增强了多租户环境,确保租户的AI工作负载能以最佳性能持续运行。NVIDIA Spectrum-X还提供了更好的AI性能可见性,它可以识别性能瓶颈,而且具有全自动网络验证功能。
NVIDIA Spectrum-X将NVIDIA Spectrum-4以太网交换机与NVIDIA BlueField-3 DPU紧密结合,取得了1.7倍的整体AI性能和能效提升,同时可在多租户环境中提供一致、可预测的性能。
Spectrum-X还提供NVIDIA加速软件和软件开发套件(SDK),使开发人员能够构建软件定义的云原生AI应用。驱动Spectrum-X的加速软件包括Cumulus Linux、纯SONiC和NetQ等性能强大的NVIDIA SDK,共同助力该网络平台实现极致性能。另外,Spectrum-X还包括BlueField DPU的核心软件——NVIDIA DOCA软件框架。
NVIDIA Spectrum-X单台交换机即可实现突破性的256个200Gb/s端口的连接,使用两层叶脊拓扑可以连接16000个端口,以支持AI云的增长和扩展,同时保持极高的性能和极低的网络延时。
作为 NVIDIA Spectrum-X参考设计的蓝图和测试平台,NVIDIA正在构建一台超大规模生成式AI超级计算机,命名为Israel-1。它将被部署在NVIDIA以色列数据中心,由基于NVIDIA HGX平台的戴尔PowerEdge XE9680服务器, BlueField-3 DPU和Spectrum-4交换机等打造而成。
04 NVIDIA ACE为游戏引入生成式AI
生成式AI引入到游戏中会产生怎样的效应呢?生成式AI将彻底改变玩家与游戏人物之间的互动方式,并极大地提高游戏沉浸感。
NVIDIA ACE帮助游戏开发者在他们的游戏和应用中建立和部署定制的语音、对话及动画AI模型。
在NVIDIA Omniverse的基础上,“ACE游戏开发版(ACE for Games)”为语音、对话和角色动画提供优化的AI基础模型,包括:NVIDIA NeMo、NVIDIA Riva、NVIDIA Omniverse Audio2Face等。
目前游戏开发者与初创公司已在其工作流上使用NVIDIA生成式AI技术,比如独立游戏开发者Fallen Leaf 用 Audio2Face 来制作《索利斯堡》(FORT SOLIS)中角色的脸部动画。
“ACE 游戏开发版(ACE for Games)”代工服务支持本地或云端部署,协助开发者微调游戏模型,然后通过 NVIDIA DGX Cloud,GeForce RTX PC 或现场加以部署,以实时进行推理。
在客户端侧,NVIDIA和微软紧密合作,使用全新的和经过强化的工具、框架和驱动程序,PC开发者可以更加轻松地开发和部署AI。例如用于优化和部署GPU加速AI模型的Microsoft Olive工具链,以及新的图形驱动程序,将大幅提升配备NVIDIA GPU的Windows PC上的DirectML性能。
这项合作将加强1亿台配备RTX GPU的PC性能,并继续扩大设备数量。这些GPU中的Tensor Core可大幅提升400多个AI加速Windows应用和游戏的性能。
05 NVIDIA Omniverse的虚实融合
生成式AI的影响不光表现在游戏内容方面,也在为价值7000亿美元的数字广告行业带来新的机遇。
全球最大的营销服务机构WPP正与NVIDIA一起在Omniverse Cloud上构建首个生成式AI内容引擎。WPP客户可以使用制作完毕的场景生成大量广告、视频和3D体验,供全球市场和用户在任何网络设备上使用。
除了数字广告,工业制造企业通过Omniverse和生成式AI 的API接口,以连接他们的设计和制造工具,从而构建工厂数字孪生。他们还使用NVIDIA Isaac Sim模拟和测试机器人,并使用视觉AI框架NVIDIA Metropolis实现光学检测的自动化。
最新组件NVIDIA Metropolis for Factories可以创建定制化的质控系统,为制造商带来竞争优势。该组件正在帮助企业开发先进的AI应用。
例如,在全球生产笔记本电脑、智能手机等300种产品的和硕,正在使用Omniverse、Isaac Sim和Metropolis创建虚拟工厂。该公司能够在虚拟工厂中的模拟环境测试各种流程,为其节省了时间和成本。
和硕还使用NVIDIA DeepStream软件开发套件开发智能视频应用,将吞吐量提高了10倍。
富士康工业互联网是这家全球超大技术制造商的服务部门,该部门携手NVIDIA Metropolis合作伙伴,一起实现其电路板质控检查点重要环节的自动化。
广达的子公司Techman Robot使用NVIDIA Isaac Sim优化其生产线上的检测。实际上,这是在使用模拟机器人,来训练机器人制造出更好的机器人。
此外,NVIDIA还发布了一个新平台,以支持下一代自主移动机器人 (AMR) 车队。 Isaac AMR可以帮助模拟、部署和管理自主移动机器人车队。
06 结语
从AI超级计算机到参考架构、网络平台,NVIDIA为生成式AI构建了坚实的底座,同时在游戏、元宇宙等应用领域开展创新工作。新的一轮计算变革箭在弦上。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。