作者:Stephanie Condon
在SC19大会上,AMD将宣布新的、基于Epyc处理器的AWS和微软Azure实例,以及Epyc的其他一些进展。
在实现了一些重要的HPC里程碑的一年之后,AMD本周展示了其在高性能计算市场的最新动作。在SC19大会上,这家芯片制造商宣布了新的、基于Epyc处理器AWS和微软Azure云实例,介绍了Epyc的新进展并且发布了ROCm 3.0版本的软件。AMD还宣布首个基于Epyc处理器的系统已经进入了TOP500名单。
AMD数据中心解决方案事业部总经理Scott Aylor对ZDNet表示,SC19大会是“我们将支持百亿亿次时代的技术推向市场的垫脚石。”
Aylor表示,指导AMD技术路线图的“北极星”是联邦政府决定投资AMD技术以建造Frontier百亿亿次超级计算机的决定。这个耗资6亿美元的百亿亿级系统——基于AMD的Epyc CPU和Radeon Instinct GPU处理器,并使用了Cray的Shasta架构和Slingshot网络——到2021年进入实验室时,将成为世界上最快的超级计算机。
在去年八月,AMD推出了第二代Epyc——全球第一款7纳米服务器处理器。处理器的性能提升为AMD带来了更好的HPC前景。
为了展示其Epyc的实力,AMD表示微软Azure正在围绕着第二代Epyc处理器构建其最高性能的HPC实例。Azure新的、针对高性能计算的HBv2使用了AMD EPYC 7742处理器,该产品目前正在进行预览。
此外,亚马逊网络服务(AWS)正在扩大对第二代Epyc处理器的使用,该公司宣布即将推出新的C5a计算密集型实例。其中包括C5a、C5ad以及裸机EC2实例。Aylor表示:“他们正在将AMD技术用于性能最高的C系列实例。”
AMD的OEM和ODM合作伙伴也正在扩大第二代Epyc的业务范围:
在最终用户方面,AMD宣布它凭借着法国高性能计算组织的GENCI系统重新跻身于全球最快超级计算机500强的榜单。该组织宣布了Joliot-Curie超级计算机的最新扩展,该系统基于Atos BullSequana XH2000,使用了EPYC 7H12处理器。
该产品赢得的其他客户包括圣地亚哥超级计算机中心的新Expanse超级计算机系统,该系统使用了Dell EMC PowerEdge服务器和第二代Epyc处理器。Expanse拥有728个双插槽Dell EMC PowerEdge C6525,这些Dell EMC PowerEdge C6525都使用了第二代AMD Epyc处理器。预计Expanse的最高性能可以达到5 petaflops。
苏黎世联邦理工学院(瑞士联邦理工学院)将使用Epyc 7742处理器为新型Euler VI超级计算机提供动力。英国原子武器机构的新型Vulcan超级计算机也将使用第二代Epyc处理器,英国最快的新型超级计算机ARCHER2也将使用该处理器。
同时,AMD还推出了ROCm 3.0版,这是一个开源、独立于编程语言的GPU计算平台。现在,它支持基于LLVM的编译器HIP-clang,并提供改进了的CUDA转换功能。它扩展了对HPC编程模型和应用程序的加速支持,例如OpenMP编程、LAMMPS和NAMD。它还为诸如Kubernetes、Singularity、SLURM、TAU等系统和工作负载部署工具提供了支持。现在ROCm还向上集成到领先的TensorFlow和PyTorch机器学习框架中,这些框架可用于增强学习、自动驾驶及图像和视频检测等应用。
好文章,需要你的鼓励
Snap 推出 Lens Studio 的 iOS 应用和网页工具,让所有技能层次的用户都能通过文字提示和简单编辑,轻松创建 AR 镜头,包括生成 AI 效果和集成 Bitmoji,从而普及 AR 创作,并持续为专业应用提供支持。
这项研究由香港理工大学和新加坡国立大学的团队共同完成,提出了R?ec,首个将推理能力内置于大型推荐模型的统一框架。与传统方法不同,R?ec在单一自回归过程中实现了推理生成和物品预测的无缝整合。研究者还设计了RecPO优化框架,无需人工标注即可同时提升模型的推理和推荐能力。实验结果显示,R?ec在三个数据集上显著超越现有方法,在Hit@5和NDCG@20指标上分别提升68.67%和45.21%。这一突破为下一代智能推荐系统开辟了新方向。
这项研究提出了CURE框架,通过强化学习让大语言模型同时学习编写代码和生成单元测试两种能力,无需使用标准代码作为监督。团队开发的ReasonFlux-Coder模型在仅用4.5K编程问题训练后,便在多个基准测试中超越了同类模型,代码生成准确率提高5.3%,最佳N选1准确率提高9.0%。该方法不仅提升了模型性能,还提高了推理效率,同时为降低API调用成本和无标签强化学习提供了新思路。