Nvidia本周一晚在洛杉矶举行的世界移动通信大会(Mobile World Congress)上宣布最新的EGX Edge超级计算平台全面上市,该平台完全是针对人工智能处理所谓“边缘数据”而打造的。
Nvidia公司创始人兼首席执行官黄仁勋表示,EGX将使企业能够利用工厂车间或者城市街道的快速流数据来大规模且更低延迟地交付“下一代AI、物联网和基于5G的服务”。
他在一份声明中表示:“我们进入了一个新的时代,在这个时代数十亿个永远在线的物联网传感器将通过5G连接并由AI处理。这就需要新型且高度安全、可以在远程轻松操作的联网计算机作为基础。因此,我们打造了Nvidia EGX Edge超级计算平台,让计算超越了个人、超越了云,可以在全球范围内运行。”
使AI能够在智能手机、传感器和工厂机器等边缘设备上运行,这是技术发展的下一个阶段。这在以前是不可能的,由于最早的AI算法非常复杂,只能在运行于云数据中心的强大计算机以进行处理,这就需要通过网络发送大量信息。但这是很麻烦的,因为它需要大量的带宽并会导致更高的延迟,所以很难实现“实时” AI。
企业真正想要的是在生成数据的地方执行AI,无论是在制造设施、零售商店还是在仓库,而这正是Nvidia EGX所瞄准的。它将Nvidia的AI技术与数据中心厂商Mellanox的安全、存储和网络技术进行了结合。Nvidia此前曾表示,计划在年底前以69亿美元的价格收购Mellanox。
EGX平台运行Nvidia Edge Stack,这是针对实时AI服务(例如分析,语音和视觉)进行了优化的软件堆栈。该平台还结合了Nvidia的CUDA-X软件、一系列针对AI的库、工具和技术,以及Nvidia认证的GPU服务器。此外,它还支持用于构建智能城市和智能视频分析应用的框架Nvidia Metropolis。
作为已经在充分使用Nvidia EGX的企业客户之一,德国汽车制造商宝马公司使用EGX从位于南卡罗来纳州制造工厂检测线的多个摄像头和传感器收集数据,以实现所谓的“智能视频分析”。
洛杉矶市也是Nvidia平台的另一个早期采用者,该市利用EGX捕获车辆数据和行人数据,自动管理街道信号计时。
EGX平台的另一个关键,是今天宣布推出的Nvidia Aerial软件开发套件。黄仁勋在主题演讲中表示,Nvidia Aerial对于5G提供商来说至关重要,因为它让5G提供商可以使用EGX来构建和交付“软件定义的高性能5G无线无线电接入网络”,包括从Mellanox网络接口卡到GPU内存的低延迟数据路径,以及5G物理层信号处理引擎,以确保所有数据都保存在GPU内存中。
他表示,电信企业借助Nvidia Aero能够构建完全虚拟化的5G RAN,以支持增强现实、虚拟现实、云游戏和智能工厂等用例。
Nvidia目前已经与瑞典网络公司Telefonaktiebolaget展开合作,建立了全球首个软件定义的5G RAN,而且两家企业正在致力于该技术商业化。
爱立信公司执行副总裁、网络业务负责人Fredrik Jejdling表示:“作为技术领导者,我们拥抱开放性和新平台,在这些平台上我们可以继续创新并突破界限,为客户提供最佳解决方案。我们将与Nvidia共同研究如何将替代解决方案推向市场,以虚拟化完整的无线电接入网络。”
Nvidia还宣布扩大与Red Hat和微软的合作伙伴关系。
首先,Nvidia将向电信企业提供运行在Red Hat OpenShift平台上的高性能、软件定义5G无线基础设施。黄仁勋表示,此举旨在让用户更容易在电信边缘访问AI应用。
同时Nvidia表示,EGX平台正在与微软Azure云紧密集成,以提供更高级的“边缘到云AI计算能力”。两家厂商将专注于智能边缘计算,帮助各个行业的企业组织更好地管理诸如零售商店、仓库、制造厂、联网建筑物和城市基础设施生成的数据,并从中获取洞察。
黄仁勋表示:“全球最大型的那些行业希望将AI计算放在边缘,从连续的数据流中提取洞察,并在行动时感知、推理并采取行动。”
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。