计算机图形芯片制造商Nvidia正在为新型超级计算机铺平道路,宣布其人工智能和高性能计算基础设施将很快支持基于Arm的CPU。
Nvidia今天早些时候表示,自己的CUDA-X AI和HPC库、GPU加速AI框架和软件开发工具将在今年年底前支持基于Arm的设备。这是重要一步,因为基于Arm的超级计算机由于具有更高功效而能够支持更大的规模。
Nvidia首席执行官黄仁勋表示:“随着传统计算扩展的结束,电力将成为限制所有超级计算机的一个因素。Nvidia的CUDA加速计算和Arm高能效CPU架构相结合,将为高性能计算领域提供一个提升突破百亿亿级性能的机会。”
Nvidia加速计算总经理兼副总裁在新闻发布会上表示,之所以决定支持基于Arm的CPU是因为他们对这个领域有着广泛而越来越浓厚的兴趣。”
“Arm吸引人之处在于它是非常开放的,它提供的灵活性可以连接CPU和GPU,实现更高能效的计算。”
由于Nvidia的寄出设施支持x86和基于POWER的计算机芯片,因此全球25个最节能的超级计算机中已经有22个采用了Nvidia的基础设施。Nvidia希望凭借对Arm芯片的支持提升自己的高性能计算领域的地位,支持更高级的人工智能工作负载。
Nvidia还希望将超级计算能力扩展到特定用途,例如为自动驾驶汽车训练AI系统。
为此,Nvidia在今天推出了所谓号称全球第22快的超级计算机——DGX SuperPOD,以及一个参考架构,面向那些希望将这个超级计算机部署在他们自己数据中心内部或者外部的企业。
Nvidia表示,DGX SuperPOD旨在提供部署大量自动驾驶车辆所需的AI训练基础设施。该系统可以三周之内部署完成,由96个Nvidia旧款DGX-2H超级计算机组成,这些超级计算机采用新的数据中心互连技术(今年早些时候收购Mellanox获得的技术)进行集成。
Nvidia表示,DGX SuperPOD旨在为自动驾驶汽车训练神经网络,使车辆可以了解“道路规则”,并提供每秒9.4 petaflops的性能,这个数字令人惊讶——以至于可以把对主流图像分类ResNet-50 AI算法的训练时间从25天缩短到不到2分钟。
Nvidia人工智能基础设施副总裁Clement Farabet在声明中表示:“要在人工智能领域占据领先地位,就需要在计算基础设施领域占据领先地位。很少有人工智能方面的挑战像训练自动驾驶汽车这样苛刻,需要对神经网络进行数万次的反复训练,以满足极高精确度的要求。”
好文章,需要你的鼓励
VMware宣布将终止现有渠道合作伙伴计划,新计划采用邀请制,大幅减少授权合作伙伴数量。未受邀合作伙伴将于2025年7月15日收到不续约通知,可继续交易至10月31日。白标计划也将同时终止。此举是18个月内VMware第二次重大合作伙伴调整,旨在专注与少数核心云服务提供商深度合作。客户可能面临续约困难、服务质量下降和成本上升等影响。
StepFun公司推出的Step1X-Edit是首个能够媲美GPT-4o和Gemini2 Flash等商业模型的开源图像编辑AI。该模型通过整合多模态语言理解和扩散图像生成技术,能够处理11种编辑任务,在新构建的GEdit-Bench基准测试中表现优异,为图像编辑技术的民主化开辟了新道路。
谷歌DeepMind和伦敦大学学院研究发现,大语言模型在面对反驳时会迅速失去信心并改变答案,即使反驳是错误的。研究显示LLM既会对自己的答案过度自信,又对批评异常敏感,表现出与人类相似但又独特的认知偏差。这种行为对多轮对话AI系统构成威胁,最新信息可能对LLM推理产生不成比例的影响。
BluOrion公司开发的ZClip是一种智能梯度裁剪算法,解决了大型语言模型训练中的梯度爆炸和损失飙升问题。通过Z分数统计检测和动态调整策略,ZClip能够自适应地控制梯度幅度,相比传统固定阈值方法提升训练效率35%以上,同时显著降低训练失败风险,为大模型训练提供了更稳定、高效的解决方案。