“黄氏定律”助力AI性能实现逐年翻倍 NVIDIA加速赋能中国行业客户业务创新原创

作者：李祥敬

以上一系列举措，其实只是NVIDIA赋能中国各行各业创新的“冰山一角”。随着中国“新基建”的推出，5G、AI等新技术不断与行业深入融合，NVIDIA依靠黄氏定律实现AI性能实现逐年翻倍，更好地满足行业的智能应用需求。

对于摩尔定律，大家都已经很熟悉了。但是你知道“黄氏定律”吗？因为通常定律都是以提出这个定律的人的名字来命名，而这个“黄氏定律”就是来自NVIDIA首席执行官黄仁勋（Jensen Huang）。

所谓“黄氏定律（Huang’s Law）”就是黄仁勋（Jensen Huang）预测GPU将推动AI性能实现逐年翻倍。而在今天举行的NVIDIA GTC中国线上大会上，NVIDIA首席科学家Bill Dally介绍了他的团队如何助力AI性能实现逐年翻倍，也就是支撑黄氏定律。

在Bill Dally看来，如果想提高计算机性能，黄氏定律就是一项重要指标。目前Bill Dally带领一个200人的研究团队，这个团队打造速度更快的AI芯片，并将其用于具有更高带宽的系统，从而简化编程。

全面产品技术创新

AI系统涉及众多组成部分，比如计算单元、网络等。所以这需要一个全面的端到端的产品组合才能满足当今人工智能创新应用的需求。只有站在整体的角度才能更好地实现AI性能提升，所以我们看到NVIDIANVIDIA在AI架构创新方面进行了诸多创新，推出了包括NVIDIA A100 80GB GPU、NVIDIA HGX AI超级计算平台、NVIDIA DGX Station A100等一系列的产品，将AI超级计算推向了一个新的高度。

众所周知，NVIDIA创建了GPU加速计算。现在，NVIDIA宣布推出一种新型处理器——DPU（Data Processing Unit，数据处理单元）。CPU、GPU和DPU的结合，可构成完全可编程的单一AI计算单元，提供前所未有的安全性和算力。目前，NVIDIA DPU产品两款PCIe产品：NVIDIA BlueField-2 DPU和NVIDIA BlueField-2X DPU。

在AI性能方面，除了计算，网络的连接效率同样非常重要。为此，NVIDIA推出了NVIDIA Mellanox 400G InfiniBand产品，其是全球第一代400Gb/s网速的端到端网络解决方案，可以将计算、可编程性和软件定义三种技术成功地融于一体，为全球的AI和HPC用户设计新一代计算系统和提升应用性能提供了新的思路。

此外，Bill Dally带领的团队还开展了一项研究，旨在以更快速的光链路取代现有系统内的电气链路，可以将连接GPU的NVLink速度提高一倍。这种名为“密集波分复用”的技术，有望在仅一毫米大小的芯片上实现Tb/s级数据的传输，是如今互连密度的十倍以上。除了更大的吞吐量，光链路也有助于打造更为密集型的系统。Dally举例展示了一个未来将搭载160多个GPU的NVIDIA DGX系统模型。

除了硬件级别的创新，NVIDIA软件方面也在积极投入，围绕数据中心和AI平台构建了丰富的平台软件应用。众所周知，MLPerf基准测试是业内首套衡量机器学习软硬件性能的通用基准。借助软硬件协同创新，NVIDIA在MLPerf训练和推理测试中取得了上佳表现，从而让NVIDIA AI平台成为“全能选手”，在数据训练与分析、推理等环节释放AI的力量。

NVIDIA研究人员专门开发了一种名为MAGNet的工具，其生成的AI推理加速器在模拟测试中，能够达到每瓦100TFLOPS的推理能力，比目前的商用芯片高出一个数量级。Bill Dally还首次公开展示了NVIDIA的对话式AI框架Jarvis与GauGAN的完美组合。GauGAN利用生成式对抗网络，只需简略构图，就能创建美丽的风景图。

众所周知，AI应用开发和部署在当前AI系统日益庞大的情况下越发变得富有挑战。为此，NVIDIA的研究人员开发了全新编程系统原型Legate。开发者借助Legate，即可在任何规模的系统上，运行针对单一GPU编写的程序——甚至适用于诸如Selene等搭载数千个GPU的巨型超级计算机。

从Bill Dally公布的一些研究方向，我们看到NVIDIA在实现“黄氏定律”方面所做的工作，这些工作涉及了NVIDIA GPU以及创新的DPU，以及NVIDIA在网络加速方面的布局。除了硬件，NVIDIA在软件方面的布局也是非常全面的，借助软件定义，底层硬件可以实现性能的最大化，更好地赋能AI系统。

助推中国产业创新

既然是GTC中国线上大会，那么关于中国的话题也就不可缺少。创新技术只有落地才能发挥出商业价值，目前NVIDIA在AI、数据科学和互联网、物流等领域的多项突破性技术在中国的落地应用，推动各行各业的AI创新。

我们看到NVIDIA推出了很多硬件级的新产品，而现在包括阿里云、百度智能云、滴滴云、腾讯云等在内的众多中国云服务提供商纷纷推出搭载了NVIDIA A100的多款云服务及GPU实例。借助云服务，中国用户可以非常容易地获取NVIDIA GPU的最新加速能力和服务。

而对于最新的DPU产品，从2018年起，UCloud就已经在探索基于NVIDIA BlueField DPU的高性能的裸金属物理云，为用户提供高吞吐、低延迟的物理网络和虚拟化网络。近日，UCloud增加云存储功能的裸金属物理云2.0产品也已上线相对于以前基于网关的裸金属物理云解决方案降低了34.4%的成本。UCloud也成为首家应用此技术的公有云厂商。

就在几天前的“双十二”购物狂欢节上，直播成为一种重要的商品销售推广方式，这直接带动了云渲染、数字人、云端特效和高质量视频处理方面的创新，而这离不开GPU的赋能。比如阿里巴巴旗下淘宝使用NVIDIA GPU计算平台，为直播和基于AI的推荐系统提供加速，从而为观众带来个性化体验；快手针对低分辨率短视频，利用GPU进行超分辨率处理，提高视频分辨率到720P或1080P；虎牙通过开发AI数字人业务，为内容创建者创造独特的用户体验，其中GPU在AI和渲染技术方面发挥了关键作用。

此外，NVIDIA提供了Video Codec SDK、Maxine、Broadcast Engine等软件加速视频分析、图像处理、语音处理和其他服务等工作负载的处理。而针对内容创作、质量提升和新兴AI用例，NVIDIA还提供了TensorRT、Triton推理服务器以及基于NVIDIA RTX构建的NVIDIA CloudXR、NVIDIA Merlin框架等产品。例如NVIDIA CloudXR平台借助腾讯云稳定、高效的云GPU计算能力，将任意终端设备（包括头戴显示器HMD和连接的Windows和安卓设备）转变为可显示专业级质量图像的高清XR显示器。

中国互联网行业迅猛发展，新的应用和业务不断出现，而这些都离不开新技术的赋能，NVIDIA提供的软硬件产品为中国互联网行业提供了源源不断的动力，更好地帮助中国互联网厂商实现业务创新。

除了互联网经济，NVIDIA也在不断推动中国实体经济的发展。说到购物，我们就不得不说物流。有调查数据显示，2019年中国AI＋配送市场的规模达1.9亿元，其中智能配送市场规模为1.1亿元。预计到2025年AI＋配送市场规模将达到13.4亿元。

JDL京东物流和NVIDIA正在合作将智能快递推向整个物流行业，把江苏常熟打造成全球首座“智能配送城”。JDL京东物流在常熟投入运营的智能快递车共有5种车型，每辆车搭载了2个NVIDIA Jetson AGX Xavier平台，可满足不同场景的配送需求。其中最大的一款车箱载货空间达2立方米，单次出发可以配送500单以上。

同时，为了进一步减轻快递员的劳动强度，JDL京东物流还推出了“智能快递车领养计划”，即在智能配送城所在区域里，京东快递员通过申请可“领养”一定数量的智能快递车配合自己的工作，这显然提升了快递员的工作效率。

当前中国人工智能市场蓬勃发展，为了更好地助力AI初创公司，英伟达初创加速计划（NVIDIA inception program）为这些初创企业提供了上市支持、专业知识和技术等。初创企业成员还可以通过NVIDIA深度学习学院（Deep Learning Institute）参加培训，可以通过我们的全球分销商网络获得硬件的优惠价格，还可以收到邀请参加独家举办的活动等。

在本届GTC中国线上大会上，从英伟达初创企业展示报名中100余家企业里脱颖而出的12家初创企业，经过40家投资机构及产业代表的参评及网络投票，进入了最终展示环节。通过这场线上视频展示，众多企业大显身手，充分彰显了初创新秀的别样风采。