通过GPU探索无限可能 NVIDIA Computex 2018展示AI新格局 原创

借助在GPU方面的积淀,NVIDIA将GPU的计算力发挥到了极致。相信随着人工智能技术的深入发展,NVIDIA将会给我们带了无限可能。

至顶网服务器频道 06月11日 新闻消息(文/李祥敬): 近日,COMPUTEX 2018盛大举行。COMPUTEX创办于1981年,30多年来一路与全球ICT产业一同成长、茁壮,见证产业发展与转变的历史性时刻。当前AI产业作为近些年异常火热的科技创新风口,受到了各界企业以及国家的重视。此次COMPUTEX 2018也有包括NVIDIA等在内的厂商与现场观众分享AI产业的机遇与挑战。特别是NVIDIA,在COMPUTEX 2018上展示了自身在AI方面的布局。

NVIDIA在面向人工智能工作负载的GPU市场上是毫无争议的领导者,NVIDIA在GPU市场一直处于领先地位,游戏业是GPU最大的用户来源。而数据中心则是其增长最快的业务市场。从业务架构来说,NVIDIA先是将90%的研发支出都投入到GPU架构和CUDA软件平台,继而将这种模式应用到各个平台:游戏、数据中心、人工智能以及自动驾驶。

NVIDIA创始人兼首席执行官黄仁勋曾表示,未来10年内,每年对于运算需求的规模将成长100倍,同时预期在摩尔定律逐渐衰减的现状下,全球前50大超级电脑的GPU运算量将在未来5年内成长15倍,同时以GPU加速运算的方式将成为延展摩尔定律的主要模式。

GPU的极致化应用:HGX-2和DGX-2

凭借在GPU计算方面的长期耕耘,2018年5月30日,英伟达宣布推出首款同时适用于人工智能和高性能计算的统一计算平台NVIDIA HGX-2。

我们知道,不管是AI还是HPC,它们对于计算力的要求都是很高的。而且AI和HPC在某些行业的算法是相通的,所以如何有效打通AI和HPC成为一个课题,NVIDIA HGX-2给出了自己的答案。

通过GPU探索无限可能 NVIDIA Computex 2018展示AI新格局

HGX-2采用了最新的NVSwitch互联技术,将16个Tesla V100 Tensor Core GPU连接。据介绍,它可提供每秒2千万亿次浮点计算的AI性能。作为参考,它的上代产品——去年于Computex 2017上发布的HGX-1,只装载了8个GPU。NVSwitch是NVIDIA在圣何塞GTC 2018大会上发布的最新GPU互联结构,在NVLink的基础上进一步进行了扩展创新,它的带宽比最好的PCIe交换机高出5倍,它可使多达16个Tesla V100 GPU同时以2.4TB/秒的速度进行通信。

接力登场的HGX-2平台具备多精度计算能力,可提供独特的灵活性。该平台能够针对科学计算和模拟进行高精度的FP64和FP32运算,并针对AI训练和推理进行 FP16 和 Int8 运算,以“多功能性”满足先进越来越多融合HPC和AI的应用对计算的需求。

NVIDIA称,HGX-2在ResNet-50训练基准下,创下了每秒15500幅图像的AI训练速度记录,可取代高达300台仅配备CPU的服务器。

HGX-2的卖点在于,它既可以用于AI训练,也可以用于推理,同时还能够为HPC应用提供计算支持。在NVIDIA的命名体系中,HGX-T用于AI训练,HGX-I用于推理,而SCX系统则用于HPC。

NVIDIA将HGX-2描述为“构建模块”,制造商可使用它来构建适用于AI和HPC的系统。事实上,现在已经有多家计算系统制造商宣布计算推出基于HGX-2计算平台的系统。包括联想、云达科技、超微和纬颖科技四家服务器制造商,他们宣布计划于今年下半年将各自的基于HGX-2系统推向市场。此外,全球四大原始设备制造商(ODM)富士康、英业达、广达和纬创也正在设计基于HGX-2的系统,有望于下半年在全球几家最大型的云数据中心投入使用。

通过GPU探索无限可能 NVIDIA Computex 2018展示AI新格局

GPU除了游戏,事实上被证明更适合大规模计算,正因为如此,英伟达已经在GPU运算力的路上越走越远。以今年3月份GTC 2018大会上推出的DGX-2为例,在两块独立的GPU板卡上配备了16块Tesla V100 GPU,每块V100拥有32GB HBM2显存(共512GB),并且采用12个NVSwitch将16块GPU采用全线速互联的方式连接,使得任意两块GPU之间P2P总带宽都是300GB,处理器采用了两颗英特尔至强Platinum CPU,而存储方面则配置了1.5TB的标准内存,采用30TB的NVMe SSD,提供了更大的缓存空间,能够实现每秒2千万亿次浮点运算(2PFLOPS),性能比去年9月推出的DGX-1性能提高了10倍。

不管是HGX-2还是DGX-2都是NVIDIA在GPU计算方面的巅峰之作,NVIDIA将对GPU计算的最新思考融入其中,用户可以体验到最新的GPU计算力。

NVIDIA Isaac让机器人更聪明

除了在GPU计算方面的深耕,NVIDIA也在将人工智能引入机器人领域,比如Jetson平台。Jetson是NVIDIA推出的嵌入式人工智能超级计算平台,可以部署在诸多终端(可能是摄像头、无人机、机器人和无人小车等)之上,令其具备人工智能计算能力。而“嵌入式”则可以很好地解决这些终端要具备人工智能计算能力所要面临的带宽不足、延迟等问题。

在Computex 2018上NVIDIA正式推出包含全新硬件、软件和虚拟世界机器人模拟器的NVIDIA Isaac。黄仁勋表示:“AI是我们这一时代最强大的技术力量。第一阶段人工智能将实现全新的软件自动化水平,从而帮助诸多行业提高生产力;其后,人工智能与传感器和执行器相结合,将成为新一代自主机器的核心。终有一天,数十亿台智能机器将用于制造、送货上门服务、仓储物流等领域。”

通过GPU探索无限可能 NVIDIA Computex 2018展示AI新格局

NVIDIA Isaac的核心是Jetson Xavier,这是全球首款专为机器人设计的计算机。它拥有超过90亿个晶体管,可提供每秒30万亿次操作以上的性能,这一处理能力高于功能强大的工作站,同时能耗仅为照明灯泡的三分之一。

Jetson Xavier拥有6种高性能处理器,包括1个Volta Tensor Core GPU、1个8核 ARM64 CPU、2个NVDLA深度学习加速器、1个图像处理器、1个视觉处理器和1个视频处理器。这些处理器使其能够同时、且实时地处理数十种算法,以用于传感器处理、测距、定位和绘图、视觉和感知以及路径规划。如此水平的性能至关重要,它让机器人能够从传感器获取输入、定位自身、感知其环境、识别并预测附近物体的运动、推理出合理动作并安全执行。

NVIDIA为Jetson Xavier的模拟、训练、验证和部署提供了一个工具箱。该机器人软件包含以下内容:

  • Isaac SDK——一套API和工具,可借助全面加速的库,开发机器人算法软件及运行时框架。
  • Isaac IMX——Isaac 智能机器加速应用,是NVIDIA开发的机器人算法软件的集合。
  • Isaac Sim——高度逼真的虚拟仿真环境,可供开发者训练自主机器,并使用Jetson Xavier进行硬件在环测试。

在边缘上拥有这个水平的AI计算能力,自主机器可以用超人的能力感知周围的世界,从各种传感器中检测和识别它们周围的环境。

制造机器人能够与人类一同安全地工作并适应变化。物流机器人能够高效地搬运和管理库存,并将产品送货到家。服务机器人能够提升零售体验,并为病人和老人群体提供帮助。

当前,机器人行业正在迎来变革期,不管是制造行业还是物流仓储,机器人的应用场景越来越广泛。而且随着机器人研究的深入,未来将有更多领域引入机器人。NVIDIA Isaac让机器人具备了更强的“思考能力”,这将极大推动机器人产业的发展。

让AI无处不在 NVIDIA更多领域布局

如上所述,作为人工智能技术平台的全球领导企业,NVIDIA正在将人工智能引入到各个领域,比如游戏、专业视觉化、数据中心、汽车等领域。在每个领域,NVIDIA都有炙手可热的产品,从硬软件到解决方案上都进行了全面布局,并已经发布和交付了一系列极具竞争力和行业影响力的产品。例如专业可视化领域的Quadro,数据中心市场的Tesla芯片等。

借助在GPU方面的积淀,NVIDIA将GPU的计算力发挥到了极致。相信随着人工智能技术的深入发展,NVIDIA将会给我们带了无限可能。

来源:至顶网服务器频道

0赞

好文章,需要你的鼓励

2018

06/11

09:17

分享

点赞

邮件订阅
白皮书