作者:Stephanie Condon
在SC19大会上,AMD将宣布新的、基于Epyc处理器的AWS和微软Azure实例,以及Epyc的其他一些进展。
在实现了一些重要的HPC里程碑的一年之后,AMD本周展示了其在高性能计算市场的最新动作。在SC19大会上,这家芯片制造商宣布了新的、基于Epyc处理器AWS和微软Azure云实例,介绍了Epyc的新进展并且发布了ROCm 3.0版本的软件。AMD还宣布首个基于Epyc处理器的系统已经进入了TOP500名单。
AMD数据中心解决方案事业部总经理Scott Aylor对ZDNet表示,SC19大会是“我们将支持百亿亿次时代的技术推向市场的垫脚石。”
Aylor表示,指导AMD技术路线图的“北极星”是联邦政府决定投资AMD技术以建造Frontier百亿亿次超级计算机的决定。这个耗资6亿美元的百亿亿级系统——基于AMD的Epyc CPU和Radeon Instinct GPU处理器,并使用了Cray的Shasta架构和Slingshot网络——到2021年进入实验室时,将成为世界上最快的超级计算机。
在去年八月,AMD推出了第二代Epyc——全球第一款7纳米服务器处理器。处理器的性能提升为AMD带来了更好的HPC前景。
为了展示其Epyc的实力,AMD表示微软Azure正在围绕着第二代Epyc处理器构建其最高性能的HPC实例。Azure新的、针对高性能计算的HBv2使用了AMD EPYC 7742处理器,该产品目前正在进行预览。
此外,亚马逊网络服务(AWS)正在扩大对第二代Epyc处理器的使用,该公司宣布即将推出新的C5a计算密集型实例。其中包括C5a、C5ad以及裸机EC2实例。Aylor表示:“他们正在将AMD技术用于性能最高的C系列实例。”
AMD的OEM和ODM合作伙伴也正在扩大第二代Epyc的业务范围:
在最终用户方面,AMD宣布它凭借着法国高性能计算组织的GENCI系统重新跻身于全球最快超级计算机500强的榜单。该组织宣布了Joliot-Curie超级计算机的最新扩展,该系统基于Atos BullSequana XH2000,使用了EPYC 7H12处理器。
该产品赢得的其他客户包括圣地亚哥超级计算机中心的新Expanse超级计算机系统,该系统使用了Dell EMC PowerEdge服务器和第二代Epyc处理器。Expanse拥有728个双插槽Dell EMC PowerEdge C6525,这些Dell EMC PowerEdge C6525都使用了第二代AMD Epyc处理器。预计Expanse的最高性能可以达到5 petaflops。
苏黎世联邦理工学院(瑞士联邦理工学院)将使用Epyc 7742处理器为新型Euler VI超级计算机提供动力。英国原子武器机构的新型Vulcan超级计算机也将使用第二代Epyc处理器,英国最快的新型超级计算机ARCHER2也将使用该处理器。
同时,AMD还推出了ROCm 3.0版,这是一个开源、独立于编程语言的GPU计算平台。现在,它支持基于LLVM的编译器HIP-clang,并提供改进了的CUDA转换功能。它扩展了对HPC编程模型和应用程序的加速支持,例如OpenMP编程、LAMMPS和NAMD。它还为诸如Kubernetes、Singularity、SLURM、TAU等系统和工作负载部署工具提供了支持。现在ROCm还向上集成到领先的TensorFlow和PyTorch机器学习框架中,这些框架可用于增强学习、自动驾驶及图像和视频检测等应用。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。