为了在人工智能和高性能计算领域保持领先水平,Nvidia在本周二晚些时候推出了一个新的计算架构,并声称将统一人工智能和高性能计算这两个快速增长的领域。
Nvidia公司首席执行官黄仁勋在台湾台北举行的GPU Technology Conference(GTC)大会上宣布推出了HGX-2云服务器平台(如图所示),针对很多结合了人工智能和高性能计算的新应用。
“我们相信未来需要一个统一的平台用于人工智能和高性能计算,”Nvidia加速计算部产品营销经理Paresh Kharya在周二的新闻发布会上这样表示。
其他人表示认同。“我认为人工智能将使高性能计算发生革命性的变化,”Moor Insights&Strategy高级分析师Karl Freund这样表示。“我估计很多超级计算中心都会部署HGX2,因为它可以为高性能计算和人工智能增加巨大的计算能力。”
更具体地说,这种新的架构可以实现包括科学计算和模拟(如天气预报)在内的各种应用,以及人工智能模型(如深度学习神经网络)的训练和运行,用于诸如图像和语音识别以及自驾汽车导航等任务。Kharya说:“这些模型正在以前所未有的速度更新,”有时甚至是每小时更新一次。
由Nvidia GPU提供动力的HGX架构是一种数据中心设备,用于微软的Project Olympus项目、Facebook的Big Basin系统、Nvidia自己的DGX-1 AI超级计算机、以及公有云计算领导者AWS的服务中。该架构的第一个版本HGX-1是在一年前推出的。
HGX-2包含16个Nvidia高端V100 GPU,为计算机制造商提供了打造系统的基本构建块。Nvidia表示,使用Nvidia NVLink芯片互连系统让这16个GPU看起来就像一个整体,提供2 petaflops的浮点运算性能。
“基本上你可以将HGX用作16个GPU组成的池,就像是一个非常大的计算资源,”Freund解释说。
Nvidia也表示,最近推出的DGX-2 AI超级计算机是第一个使用HGX-2的系统。它将在第三季度销售,售价为399,000美元。黄仁勋在主题演讲中开玩笑说,它有“很大的价值”。
Nvidia已经打造了三类服务器,这些服务器将CPU与GPU混合用于人工智能训练、人工智能推理、模型运行、以及超级计算的优化配置。
Kharya将HGX架构定位为类似于英特尔和微软开发的ATX个人电脑主板配置标准,后者导致许多公司制造兼容系统组件的爆炸式增长。
周二宣布计划推出支持HGX-2的服务器制造商包括联想、QTC、超微、Wiwynn公司。另外,所ODM厂商商鸿海精密工业公司(Foxconn)、英业达(Inventec)、广达电脑(Quanta Computer)和纬创公司(Wistron),全球一些最大的云数据中心都在使用他们的系统。他们称将在今年晚些时候推出HGX-2系统。
与此同时,英特尔正加紧扩大在人工智能计算方面的业务,上周预览了一款新型芯片,预计在2019年晚些时候发布该芯片。英特尔表示,该芯片旨在更快地构建人工智能模型。英特尔人工智能集团负责人Naveen Rao抨击了Nvidia,称关于GPU比英特尔最新至强处理器快得多的说法是一个“神话”。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。