全球超级计算机领导者Cray采用AMD EPYC 7000系列处理器,为新型Cray CS500集群高性能计算(HPC)系统提供计算动力。
采用AMD EPYC 7000处理器的Cray CS500集群系统将配备4个双路节点,并装入标准2U机箱中,每个节点支持2个PCIe Gen3 x16插槽,提供200Gb网络功能以及多种存储选项。
AMD EPYC 7000处理器支持最多32个内核,每个插槽8个DDR4内存通道。Cray表示,这款处理器非常适合要求高密度和大内存带宽的高性能计算应用,如计算流体动力学(CFD)等应用。
灵活性是Cray CS500设计的核心。在系统级,CS500集群提供了多个机箱、刀片和节点选项,多种互连拓扑选项,本地存储和网络附加文件系统选项,以及符合大型高性能计算群集需求的系统管理功能。为了扩大这种灵活性,Cray为CS500产品增加了AMD EPYC处理器。
Cray集群软件堆栈
Cray产品副总裁、首席营销官Fred Kohout表示:“我们决定在CS500产品系列中提供AMD EPYC处理器,这标志着Cray致力于向社区提供全面的高密度系统产品线和优化的编程环境,以提供所需的性能和可扩展性。”
AMD副总裁、数据中心和嵌入式解决方案总经理Scott Aylor表示:“Cray在超级计算领域的领导地位众所周知,AMD很高兴能够在CS500集群系统上与Cray展开合作。Cray是第一个为AMD EPYC处理器提供优化编程环境的系统供应商,这是一个明显的优势。将AMD EPYC处理器与Cray的超级计算专业技术相结合,为两家公司的发展提供了新的机遇。”
本月早些时候,雅虎日本成为首家部署采用AMD EPYC处理器的单路PowerEdge服务器的日本ISP。今年早些时候,Dell EMC推出了一系列基于EPYC的单路和双路PowerEdge服务器,总体拥有成本降低了20%,HPC性能提高了25%。
2017年12月,中国互联网搜索巨头、人工智能领头羊百度公司宣布推出基于AMD EPYC的人工智能、大数据和云计算(ABC)服务。
同月,微软成为第一家在其数据中心中使用EPYC处理器的全球云提供商。同年11月,EPYC驱动的全新HPE ProLiant DL385 Gen10服务器创造了新的世界纪录。
采用AMD EPYC处理器的Cray CS500系统将与采用英特尔至强处理器的产品一起向市场提供,并将于2018年夏季上市。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。