为了在人工智能和高性能计算领域保持领先水平,Nvidia在本周二晚些时候推出了一个新的计算架构,并声称将统一人工智能和高性能计算这两个快速增长的领域。
Nvidia公司首席执行官黄仁勋在台湾台北举行的GPU Technology Conference(GTC)大会上宣布推出了HGX-2云服务器平台(如图所示),针对很多结合了人工智能和高性能计算的新应用。
“我们相信未来需要一个统一的平台用于人工智能和高性能计算,”Nvidia加速计算部产品营销经理Paresh Kharya在周二的新闻发布会上这样表示。
其他人表示认同。“我认为人工智能将使高性能计算发生革命性的变化,”Moor Insights&Strategy高级分析师Karl Freund这样表示。“我估计很多超级计算中心都会部署HGX2,因为它可以为高性能计算和人工智能增加巨大的计算能力。”
更具体地说,这种新的架构可以实现包括科学计算和模拟(如天气预报)在内的各种应用,以及人工智能模型(如深度学习神经网络)的训练和运行,用于诸如图像和语音识别以及自驾汽车导航等任务。Kharya说:“这些模型正在以前所未有的速度更新,”有时甚至是每小时更新一次。
由Nvidia GPU提供动力的HGX架构是一种数据中心设备,用于微软的Project Olympus项目、Facebook的Big Basin系统、Nvidia自己的DGX-1 AI超级计算机、以及公有云计算领导者AWS的服务中。该架构的第一个版本HGX-1是在一年前推出的。
HGX-2包含16个Nvidia高端V100 GPU,为计算机制造商提供了打造系统的基本构建块。Nvidia表示,使用Nvidia NVLink芯片互连系统让这16个GPU看起来就像一个整体,提供2 petaflops的浮点运算性能。
“基本上你可以将HGX用作16个GPU组成的池,就像是一个非常大的计算资源,”Freund解释说。
Nvidia也表示,最近推出的DGX-2 AI超级计算机是第一个使用HGX-2的系统。它将在第三季度销售,售价为399,000美元。黄仁勋在主题演讲中开玩笑说,它有“很大的价值”。
Nvidia已经打造了三类服务器,这些服务器将CPU与GPU混合用于人工智能训练、人工智能推理、模型运行、以及超级计算的优化配置。
Kharya将HGX架构定位为类似于英特尔和微软开发的ATX个人电脑主板配置标准,后者导致许多公司制造兼容系统组件的爆炸式增长。
周二宣布计划推出支持HGX-2的服务器制造商包括联想、QTC、超微、Wiwynn公司。另外,所ODM厂商商鸿海精密工业公司(Foxconn)、英业达(Inventec)、广达电脑(Quanta Computer)和纬创公司(Wistron),全球一些最大的云数据中心都在使用他们的系统。他们称将在今年晚些时候推出HGX-2系统。
与此同时,英特尔正加紧扩大在人工智能计算方面的业务,上周预览了一款新型芯片,预计在2019年晚些时候发布该芯片。英特尔表示,该芯片旨在更快地构建人工智能模型。英特尔人工智能集团负责人Naveen Rao抨击了Nvidia,称关于GPU比英特尔最新至强处理器快得多的说法是一个“神话”。
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。