如果大家有印象的话,去年NVIDIA GTC大会,NVIDIA首席执行官黄仁勋在自家厨房进行大会演讲应该是无出其右了。转眼今年的GTC大会再次来临,黄仁勋的”厨房“发布会再度上演。虽然场景没有变,但是发布的内容确实”料“更多,涉及了AI、汽车、机器人、5G、实时图形、协作和数据中心等。
黄仁勋说,NVIDIA会一如既往在CPU、DPU和GPU方面大力投入,并使其能够用于研究人员和企业的全新数据中心级计算解决方案。硬件只是NVIDIA的一方面,作为一家软件公司,NVIDIA提供一系列基于NVIDIA AI,以及用于仿真、协作和自主机器训练的软件。
组合拳——CPU、DPU和GPU
我们知道GPU是NVIDIA的”主业“,但是凭借一系列的收购,NVIDIA也在向其他XPU拓展,在本次大会上,NVIDIA推出了CPU、DPU和GPU的”组合拳“,帮助用户打造完全可编程的单一AI计算单元。
CPU与GPU一直是好朋友,NVIDIA GPU作为加速计算组件,其实扮演了与CPU一起工作的角色。如今NVIDIA也推出了自己的首款数据中心CPU——Grace,Grace是一款高度专用型处理器,主要面向大型数据密集型HPC和AI应用。
Grace是高度专业化的处理器,工作负载面向例如训练具有超过1万亿个参数的新一代NLP模型等。当与NVIDIA GPU紧密耦合时,搭载Grace CPU的系统速度比如今基于NVIDIA DGX 打造的最先进的系统(在x86 CPU上运行)快10倍。从这样的成绩可以看出,NVIDIA推出自有CPU芯片意在更好地实现与GPU的协同处理,让性能表现更优秀。
Grace基于第四代 NVIDIA NVLink互联技术,支持LPDDR5x内存子系统,并可以得到NVIDIA HPC软件开发套件以及全套CUDA和CUDA-X库的支持。据悉,瑞士国家超级计算中心将构建一台名为Alps的超级计算机。这台计算机将使用Grace和NVIDIA下一代GPU。美国能源部下属的洛斯阿拉莫斯国家实验室也将在2023年推出一台基于Grace的超级计算机。
除了自研的CPU,凭借收购而来的Arm,也让NVIDIA在CPU方面有了更多的话语权。在云计算、企业和边缘数据中心、超级计算、PC等其他市场中,Arm也开始崭露头角。黄仁勋也宣布与多家重要的Arm合作伙伴展开合作,包括云计算领域的AWS、科学和云计算领域的Ampere Computing、超融合边缘服务器领域的Marvel、以及将打造Chrome OS和Linux PC SDK与参考系统的联发科。
DPU(Data Processing Unit,数据处理单元)是NVIDIA在收购Mellanox推出的创新产品,其可实现具有突破性的网络、存储和安全性能。作为业内首款400G以太网和NDR InfiniBand DPU,BlueField-3具有出色的网络性能。相比上一代产品,它具有10倍加速计算能力、16个Arm A78 CPU核,和4倍的加密速度。BlueField-3也是首款支持第五代PCIe总线并提供数据中心时间同步加速的DPU。
此外,BlueField-3利用NVIDIA DOCA(集数据中心于芯片的架构)软件开发包的优势,为开发者提供一个完整、开放的软件平台,开发在BlueField DPU上开发软件定义和硬件加速的网络、存储、安全和管理等应用。目前服务器制造商戴尔、浪潮、联想和超微正在将BlueField DPU集成到他们的系统中,云服务供应商也在使用BlueField DPU来加速他们的业务,如百度、京东和UCloud。
黄仁勋还提到了NVIDIA的AI-on-5G计算平台,该平台充分利用 NVIDIA Aerial软件开发套件与NVIDIA BlueField-2 A100——一种包含NVIDIA “5T for 5G”解决方案的、集成GPU和DPU的融合型卡,创建高性能5G RAN和AI应用。富士通、Google Cloud、Mavenir、Radisys和Wind River等合作伙伴都在开发适用于NVIDIA AI-on-5G平台的解决方案。
不管是CPU还是DPU、GPU,很明显,NVIDIA正在将自己业务边界不断延展,也就是不再局限于以GPU为中心,而是以计算为核心,覆盖多样化的计算工作负载。随之而来的就是客户选择的灵活性,同时整个计算芯片市场也将迎来新的格局。
NVIDIA是软件平台公司
除了更富的硬件产品,NVIDIA在软件方面的布局也业界有目共睹的,比如CUDA。所以,我们通常会在GTC大会上看到一系列的软件更新。
在本届大会上,NVIDIA发布了用于训练Transformers的框架—— NVIDIA Megatron。Transformers在自然语言处理领域具有至关重要的位置,其在生成文档摘要、将电子邮件中的短语补充完整、对测验进行评分、生成体育赛事现场评论、甚至生成代码等领域有着广泛的应用。
此外,NVIDIA还发布了用于计算药物研发加速库Clara Discovery的一些新模型,以及与Schrodinger的合作;用于对话式AI的NVIDIA Jarvis已经可用,其能够实现语音识别、语言理解、翻译和表达性语音;加快推荐系统的NVIDIA Merlin现可通过NGC(NVIDIA的深度学习框架容器目录)获取。
为帮助客户将自身专业知识应用于AI领域,黄仁勋发布了NVIDIA TAO,其可以运用客户和合作伙伴的数据,对NVIDIA预训练模型进行微调和适配,同时保护数据隐私。
量子计算也是当下的热点,NVIDIA cuQuantum能够为量子电路模拟器提供加速,以助力研究人员设计出更完善的量子计算机。
为了保障现代化数据中心的安全,黄仁勋发布了NVIDIA Morpheus数据中心安全平台,其基于NVIDIA AI、NVIDIA BlueField、Net-Q网络遥测软件和EGX而构建,能够对完整的数据包进行实时检测。
开箱即用的产品
有了硬件又有了软件,NVIDIA为用户打造更加开箱即用的解决方案,其中包括专为工作组打造的“便携式AI数据中心”——NVIDIA DGX Station,以及NVIDIA专为密集型AI研发打造的AI数据中心产品——NVIDIA DGX SuperPod。
全新DGX Station 320G借助320GB超快速HBM2e连接至4个NVIDIA A100 GPU,内存带宽达到每秒8TB。然而,仅需将其插入普通的壁装电源插座即可使用,耗电量只有1500瓦。此外,NVIDIA还发布了一种适用于NVIDIA DGX Station A100的订阅服务。DGX Station A100是世界上唯一支持 NVIDIA多实例GPU技术的适用于办公室场景的工作组服务器设备。
DGX SuperPOD是配备20套或以上NVIDIA DGX A100系统和NVIDIA InfiniBand HDR网络的AI超级计算机。DGX SuperPOD使用全新80GB NVIDIA A100,将其HBM2e内存提升至90TB。目前它已经升级至采用NVIDIA BlueField-2,且NVIDIA如今还为该产品提供配套的NVIDIA Base Command DGX管理和编排工具。
为进一步实现AI民主化,黄仁勋发布了来自顶尖制造商的新系列NVIDIA认证系统,即大容量企业级服务器。它们现在已通过认证,可运行NVIDIA AI Enterprise软件套件,该套件得到了全球应用最广泛的计算虚拟化平台——VMware vSphere 7的独家认证。
NVIDIA于今日发布多款新系统,以扩大NVIDIA认证服务器生态系统。这些新系统配备用于主流AI和数据分析的NVIDIA A30 GPU,以及用于AI图形、虚拟工作站以及混合计算和图形工作负载的NVIDIA A10 GPU。
最后,NVIDIA推出推理服务器NVIDIA Triton,它可以从进入客户EGX服务器或云实例的连续数据流中获取洞察。这包括任何在cuDNN上运行的AI模型,也就是几乎所有的AI ,包括来自TensorFlow、Pytorch、ONNX、OpenVINO、TensorRT等的任何框架。
其他——仿真协作与自动驾驶
在大会上,NVIDIA还公布了其他产品更新,比如NVIDIA Omniverse,其旨在创建共享虚拟3D世界,特点包括:可以扩展至多个GPU、具有高物理精度、能够充分运用RTX实时路径追踪和DLSS、可以使用NVIDIA MDL模拟材料、可以使用NVIDIA PhysX模拟物理学并且与NVIDIA AI完全集成。
3D制作团队通常规模庞大、应用技术繁多且所在地点分散,NVIDIA Omniverse Enterprise使其能够在复杂的项目中开展无缝协作。设计师、艺术家和审核人员可以在任何地点、任何设备上进行线上实时协作,而不需要召开面对面会议或就大量文件进行交流和迭代。
Omniverse Enterprise是一个全新的平台,它包含NVIDIA Omniverse Nucleus服务器(管理客户端之间的共享数据库)和NVIDIA Omniverse Connectors(业内领先的设计应用程序插件)。
它还包含两个终端用户应用:NVIDIA Omniverse Create,可加速场景构成,用户可通过实时互动来装配、点亮、模拟和渲染场景;NVIDIA Omniverse View,支持无缝设计协作,并能通过逼真的渲染技术实现建筑和工程项目的可视化。该平台还包含NVIDIA RTX Virtual Workstation(vWS)软件,它能让协作者在任何地方自由地运行各类图形密集型3D应用。
Omniverse Enterprise经测试和优化后,适合专业人员在NVIDIA RTX笔记本电脑及台式电脑上运行,或在NVIDIA EGX平台上的NVIDIA认证系统上运行。因此,从使用本地台式电脑、笔记本电脑的小型工作组,到使用各种设备访问数据中心的全球分布式团队,任何规模的组织都可以部署该工具。
自动驾驶汽车领域是“机器学习和机器人技术所面对的最严峻的挑战之一,NVIDIA构建模块化的端到端解决方案,其自动驾驶汽车计算系统级芯片——NVIDIA DRIVE Orin将于2022年投产。与此同时,NVIDIA新一代车载系统级芯片NVIDIA DRIVE Atlan正式发布,其集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域的所有技术之大成,为汽车带来真正的数据中心。Atlan可以达到每秒超过1000万亿次(TOPS)运算次数,致力于应用到2025年的车型。
NVIDIA第八代Hyperion汽车平台也同期发布,包括参考传感器、自动驾驶汽车和中央计算机、3D地面真实数据记录仪、网络以及所有必要的软件。在软件方面,正如Omniverse能够构建汽车生产工厂的数字孪生一样,DRIVE Sim也可用于创建自动驾驶汽车的数字孪生,并将其用于自动驾驶汽车的开发。
总结划重点
”厨房“发布会全程看下来,应该说看点颇多。但是总结一下,无外乎以下几点:
如今是一家能够提供GPU、CPU和DPU三种芯片的公司。
NVIDIA是一家软件平台公司。
NVIDIA是一家AI公司,提供Megatron、Jarvis、Merlin、Maxine、Isaac、Metropolis、Clara和DRIVE、以及各种可使用TAO进行定制化的预训练模型。
NVIDIA正在通过用于研究的DGX、用于云的HGX、用于企业级和5G边缘的EGX以及用于机器人技术的AGX来扩展AI。
总之,NVIDIA正在变得越来越”重“,基于已有产品,其业务领域不断扩展。我们对于NVIDIA的定位和认知也正在刷新。
好文章,需要你的鼓励
他认为,AI的发展和影响被普遍低估,它所带来的变革将远超目前人们的认知,AI的进展速度异常迅猛,每次的技术飞跃都比人们预期的
GPU应用已深刻影响各类业务(搜广推、音视频、MMU、风控等)场景,快手内部GPU在线服务及离线训练任务均完成云原生化迁移。
目前华为 Mate X6 折叠屏手机仍然按照华为近年来的宣传管理,官方并没有就具体配置方案进行大张旗鼓的宣发,配置爆料信息也同样较