GPU制造商Nvidia今天宣布了三项超级计算机相关创新,旨在扩展设计以便在更多数据中心内支持人工智能工作负载。
特别是Nvidia引入了基于Arm的服务器参考架构、可扩展的微软Azure云可访问超级计算机、面向数据科学家和人工智能的Magnum IO软件套件。Nvidia的GPU已经成为人工智能的首选处理器,因为Nvidia的GPU提供了支持图形和游戏的高度并行处理,被证明是机器学习的理想选择。
Nvidia首席执行官黄仁勋今天在SC19超级计算大会上发布了基于Arm的服务器架构参考平台。这个由硬件和软件构建块组成的参考设计平台,将使高性能计算开发行业能够利用更为广泛的CPU架构。
该平台将使超级计算中心、超大规模云运营商和企业把Nvidia基于CUDA软件的图形计算芯片与最新基于Arm的服务器平台相结合。
黄仁勋表示:“高性能计算领域正在复兴。机器学习和人工智能技术的突破,正在重新定义着各种科学方法,并为新架构提供了机会。将Nvidia GPU带入Arm体系中,将为创新者打开一扇大门,为创建从超大规模云到百亿亿次超级计算乃至更多新应用提供了系统。”
为了构建这个参考平台,Nvidia与Arm及其生态系统合作伙伴(包括Ampere Computing、Fujitsu和Marvell)展开了合作,以及与HPE及其子公司Cray的深度合作。
Nvidia还宣布开始支持微软Azure云NDv2超大型实例,该实例使用多达800个Nvidia Tensor Core GPU,连接到一个Mellanox InfiniBand后端网络上。
Nvidia表示,这让客户第一次可以在办公桌上就能按需租用整个人工智能超级计算机。
Nvidia副总裁兼加速计算总经理Ian Buck表示:“到目前为止,仍然只有全球最大型的企业组织能够使用面向人工智能和高性能计算的超级计算机。这款新产品实现了人工智能大众化,让人们使用一款基本工具就能解决一些最为严峻的挑战。”
这款新产品非常适合人工智能和机器学习工作负载,其性能优势远远超过传统基于CPU的计算。
微软和Nvidia的工程师使用64个NDv2实例在集群的预发布版本上训练BERT(一种流行的自然语言会话AI模型),时间仅仅花费了三个小时,而且一部分是通过Nvidia CUDA核心技术和Mellanox互连实现的。
Magnum IO是一款软件套件,旨在帮助数据科学家、人工智能和高性能计算研究人员能够在数分钟而不是数小时内处理大量的数据。
该软件套件和工具与传统模型相比,当处理海量数据集能够为多服务器、多GPU计算节点提供高达20倍的数据传输速度,因此非常适合进行大规模的复杂财务分析、气候建模和其他高性能计算工作负载。
黄仁勋表示:“处理大量收集来的数据或者模拟数据是像人工智能这样的数据科学的核心。”
Nvidia通过与计算、网络和存储领域的众多行业领导者紧密合作开发了Magnum IO,包括DataDirect Networks、Excelero、IBM、Mellanox和WekaIOLtd。
Magnum IO的核心是GPUDirect,该架构允许数据绕过CPU并使用GPU、存储和网络设备提供的“开放高速公路”来处理数据,发布之初该架构兼容众多采用点对点和远程访问直接内存的通信互连。
黄仁勋表示:“极端计算需要极端的I/O。Magnum IO通过将Nvidia GPU加速——具有革命性的计算基数——引入I/O和存储来实现这一点。现在,人工智能研究人员和数据科学家不用等待漫长的数据处理,可以把精力放在完成自己的工作上。”
最新推出的元素是GPUDirect Storage,它让研究人员可以在访问存储时绕过CPU,快速处理数据文件以进行仿真、分析或可视化。
Nvidia Magnum IO现已上市,但不包含GPUDirect Storage,GPUDirect Storage仅面向某些选定的早期客户,计划于2020年上半年全面上市。
好文章,需要你的鼓励
CIO们正面临众多复杂挑战,其多样性值得关注。除了企业安全和成本控制等传统问题,人工智能快速发展和地缘政治环境正在颠覆常规业务模式。主要挑战包括:AI技术快速演进、IT部门AI应用、AI网络攻击威胁、AIOps智能运维、快速实现价值、地缘政治影响、成本控制、人才短缺、安全风险管理以及未来准备等十个方面。
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
过去两年间,许多组织启动了大量AI概念验证项目,但失败率高且投资回报率令人失望。如今出现新趋势,组织开始重新评估AI实验的撒网策略。IT观察者发现,许多组织正在减少AI概念验证项目数量,IT领导转向商业AI工具,专注于有限的战略性目标用例。专家表示,组织正从大规模实验转向更专注、结果导向的AI部署,优先考虑能深度融入运营工作流程并产生可衡量结果的少数用例。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。