作者:Stephanie Condon
在SC19大会上,AMD将宣布新的、基于Epyc处理器的AWS和微软Azure实例,以及Epyc的其他一些进展。
在实现了一些重要的HPC里程碑的一年之后,AMD本周展示了其在高性能计算市场的最新动作。在SC19大会上,这家芯片制造商宣布了新的、基于Epyc处理器AWS和微软Azure云实例,介绍了Epyc的新进展并且发布了ROCm 3.0版本的软件。AMD还宣布首个基于Epyc处理器的系统已经进入了TOP500名单。
AMD数据中心解决方案事业部总经理Scott Aylor对ZDNet表示,SC19大会是“我们将支持百亿亿次时代的技术推向市场的垫脚石。”
Aylor表示,指导AMD技术路线图的“北极星”是联邦政府决定投资AMD技术以建造Frontier百亿亿次超级计算机的决定。这个耗资6亿美元的百亿亿级系统——基于AMD的Epyc CPU和Radeon Instinct GPU处理器,并使用了Cray的Shasta架构和Slingshot网络——到2021年进入实验室时,将成为世界上最快的超级计算机。
在去年八月,AMD推出了第二代Epyc——全球第一款7纳米服务器处理器。处理器的性能提升为AMD带来了更好的HPC前景。
为了展示其Epyc的实力,AMD表示微软Azure正在围绕着第二代Epyc处理器构建其最高性能的HPC实例。Azure新的、针对高性能计算的HBv2使用了AMD EPYC 7742处理器,该产品目前正在进行预览。
此外,亚马逊网络服务(AWS)正在扩大对第二代Epyc处理器的使用,该公司宣布即将推出新的C5a计算密集型实例。其中包括C5a、C5ad以及裸机EC2实例。Aylor表示:“他们正在将AMD技术用于性能最高的C系列实例。”
AMD的OEM和ODM合作伙伴也正在扩大第二代Epyc的业务范围:
在最终用户方面,AMD宣布它凭借着法国高性能计算组织的GENCI系统重新跻身于全球最快超级计算机500强的榜单。该组织宣布了Joliot-Curie超级计算机的最新扩展,该系统基于Atos BullSequana XH2000,使用了EPYC 7H12处理器。
该产品赢得的其他客户包括圣地亚哥超级计算机中心的新Expanse超级计算机系统,该系统使用了Dell EMC PowerEdge服务器和第二代Epyc处理器。Expanse拥有728个双插槽Dell EMC PowerEdge C6525,这些Dell EMC PowerEdge C6525都使用了第二代AMD Epyc处理器。预计Expanse的最高性能可以达到5 petaflops。
苏黎世联邦理工学院(瑞士联邦理工学院)将使用Epyc 7742处理器为新型Euler VI超级计算机提供动力。英国原子武器机构的新型Vulcan超级计算机也将使用第二代Epyc处理器,英国最快的新型超级计算机ARCHER2也将使用该处理器。
同时,AMD还推出了ROCm 3.0版,这是一个开源、独立于编程语言的GPU计算平台。现在,它支持基于LLVM的编译器HIP-clang,并提供改进了的CUDA转换功能。它扩展了对HPC编程模型和应用程序的加速支持,例如OpenMP编程、LAMMPS和NAMD。它还为诸如Kubernetes、Singularity、SLURM、TAU等系统和工作负载部署工具提供了支持。现在ROCm还向上集成到领先的TensorFlow和PyTorch机器学习框架中,这些框架可用于增强学习、自动驾驶及图像和视频检测等应用。
好文章,需要你的鼓励
前沿AI研究机构Decart发布最新世界模型Oasis 3,旨在弥合虚拟仿真与物理AI之间的鸿沟。该模型将超写实交互图形能力与强大物理引擎相结合,可生成动作驱动的视频流,支持多视角环境模拟,延迟低于200毫秒。开发者能够借助自然语言提示,快速构建多样化极端场景,有效解决机器人和自动驾驶领域长期存在的"仿真到现实"差距问题,大幅降低物理AI训练成本。
OpenSkill是一套让AI代理无需人工监督即可自主成长的框架,通过从互联网获取知识、自建虚拟考题反复练习,实现真正的开放世界自我演化。
Visual Components正式发布5.1版本工厂仿真软件,重点引入高精度物理仿真与可扩展机器人协同调度能力,支持在同一环境中同时模拟数百台自主移动机器人、自动导引车及人员的运行状态。新版本还将仿真性能提升至前代的10倍,新增Allen-Bradley PLC支持及Nachi、Epson机器人虚拟调试插件,并将脚本环境升级至Python 3。该软件旨在帮助制造商在实际部署前完成系统验证,降低调试风险,缩短投产周期。
论文研究了AI评委同时优化多个评判维度时的两大失败原因:梯度稀释与指令干扰,为多目标提示词优化提供了系统性诊断框架。