Nvidia正在加紧为网络边缘的5G应用提供动力,在Nvidia Aerial A100 AI-on-5G平台上增加对Arm CPU的支持。
Aerial A100 AI-on-5G是一个统一的融合平台,旨在提供边缘人工智能计算和5G连接。该平台将于4月推出,它把Nvidia Aerial软件开发套件与Nvidia BlueField-2 A100融合卡相结合,后者可以将多个CPU与Nvidia的数据中心处理单元进行配对。
该平台可以为高性能、软件定义的5G基站和人工智能应用提供支持,例如精密制造的机器人、自动导引车、无人机、无线摄像头、自助结账等。换句话说,它为企业提供了在边缘部署智能服务的一个选择。
因为Aerial A100 AI-on-5G平台已经支持英特尔的x86 CPU,所以今天Nvidia在巴塞罗那MWC世界移动通信展上发布的这项公告,有望为用户带来更多选择。Nvidia称,经过Nvidia认证的系统将创造一个“简化的路径,可构建和部署自托管的vRAN,把AI和5G带给私营企业、网络设备公司、软件制造商和电信服务提供商。”
Nvidia表示,Aerial A100 AI-on-5G平台的Arm版本将配置16个Arm Cortex A78处理器,以及即将推出的Nvidia BlueField-3 DPU,从而形成一个独立的融合卡,用于在云原生5G上运行边缘AI应用虚拟无线电区域网络。
Nvidia宣布支持Arm CPU并不令人意外,因为Nvidia正在以400亿美元收购Arm的过程中,这项交易正在接受监管机构的审查,预计要到明年才能完成。
Nvidia电信行业高级副总裁Ronnie Vasishta表示:“我们正在将计算人工智能和电信5G相结合,为5G上的人工智能创建一个软件定义的平台。通过支持Arm,我们不断成长的Aerial平台将加速推进无处不在的‘AI-on-5G’。”
据称,Nvidia的BlueField-3 A100 DPU是专为人工智能和加速计算工作负载设计开发的。它针对5G连接进行了优化,旨在与CPU协同工作。该DPU负责基础设施管理任务,例如扫描网络流量中的恶意软件和调度存储容量,通常这些任务是由CPU处理的,因此把这些任务卸载到DPU,可以让CPU资源释放出来专注用于运行计算任务。”
BlueField-3 DPU将于2022年上半年上市,届时还将搭载Nvidia的AI软件库,包括预训练的模型和Aerial 5G SDK,帮助开发人员缩短部署时间,向他们的应用中添加各种AI功能。
“Bluefield-3结合了Nvidia加速计算和Arm的性能水平,这一组合有助于扩大Arm的生态系统,让网络供应商在创建和部署5G系统方面有更多的选择,”Arm公司高级副总裁、基础设施业务线总经理Chris Bergey这样表示。
首个AI-on-5G创新实验室
打造平台是一回事,但让客户采用这个平台就是另一回事了。因此,Nvidia宣布与谷歌展开合作,创建了首个AI-on-5G创新实验室。
该实验室主要面向那些希望在Nvidia这个新平台上开发和测试解决方案的网络基础设施提供商和AI软件开发者。谷歌将主要贡献他们的Google Anthos平台,用于开发多云和边缘应用。
这对开发者来说是有一定吸引力的,因为Anthos本身就是一个受欢迎的产品,让开发者可以创建由Kubernetes管理的云原生容器化应用,运行在任何类型的云或边缘基础设施上。
谷歌云网络副总裁兼总经理Shailesh Shukla表示:“通过Anthos应用平台,谷歌云将让很多垂直市场的服务提供商和企业能够在网络边缘通过5G进行无缝连接。我们很高兴能够扩大与Nvidia的合作。”
两家公司表示,希望在今年年底之前启动并运行该实验室。
Constellation Research分析师Holger Mueller认为,5G和边缘的争夺战主要是集中在是在平台方面的,谁能够开发出最吸引人的产品并且得到最多企业的采用,谁就将赢得这场竞赛。
“Nvidia在这两方面都取得了进展,一方面Nvidia在5G人工智能软件平台上增加了对Arm芯片的支持,另一方面在企业采用方面,Nvidia与谷歌展开合作,使企业能够熟悉他们的5G AI平台并使用谷歌Anthos为其构建应用。”
好文章,需要你的鼓励
北京大学研究团队开发出基于RRAM芯片的高精度模拟矩阵计算系统,通过将低精度模拟运算与迭代优化结合,突破了模拟计算的精度瓶颈。该系统在大规模MIMO通信测试中仅需2-3次迭代就达到数字处理器性能,吞吐量和能效分别提升10倍和3-5倍,为后摩尔时代计算架构提供了新方向。
普拉大学研究团队开发的BPMN助手系统利用大语言模型技术,通过创新的JSON中间表示方法,实现了自然语言到标准BPMN流程图的自动转换。该系统不仅在生成速度上比传统XML方法快一倍,在流程编辑成功率上也有显著提升,为降低业务流程建模的技术门槛提供了有效解决方案。
谷歌宣布已将约3万个生产软件包移植到Arm架构,计划全面转换以便在自研Axion芯片和x86处理器上运行工作负载。YouTube、Gmail和BigQuery等服务已在x86和Axion Arm CPU上运行。谷歌开发了名为CogniPort的AI工具协助迁移,成功率约30%。公司声称Axion服务器相比x86实例具有65%的性价比优势和60%的能效提升。
北京大学联合团队发布开源统一视频模型UniVid,首次实现AI同时理解和生成视频。该模型采用创新的温度模态对齐技术和金字塔反思机制,在权威测试中超越现有最佳系统,视频生成质量提升2.2%,问答准确率分别提升1.0%和3.3%。这项突破为视频AI应用开辟新前景。