美国橡树岭国家实验室(Oak Ridge National Laboratory)的Frontier超级计算机在全球最快超级计算机Top500榜单中名列前茅。
今天发布的最新版Top500榜单中,Frontier成为全球速度最快的超级计算机,性能为每秒1.102 exaflops(exaflop等于每秒100万万亿次计算操作)。Frontier的性能是使用HPL这一主流的基准测试进行衡量的。
此前Top500榜单的头把交椅是位于日本神户的Fugaku超级计算机,Fugaku在HPL基准测试中实现了442 petaflops的性能,理论最高速度据称超过了1 exaflop。
美国能源部在2019年5月公布了一项科技计划,其中就包括了Frontier超级计算机。美国能源部将Frontier超级计算机的开发任务委托给了AMD和超级计算机制造商Cray。
就在该计划公布的几天之后,HPE宣布签署协议以13亿美元的价格收购了Cray,这次收购也让HPE成为超级计算市场中最大的厂商之一。此后,HPE将Cray的产品纳入了自己的超级计算产品组合中。
Frontier系统中包含了74个HPE Cray EX机柜,每个机柜可容纳128个刀片(一种紧凑型服务器)。刀片通常比标准数据中心服务器的组件更少,更易于冷却,与硬件维护相关的某些任务也更为简单。
Frontier系统中的每个刀片都采用了1个AMD的Epyc处理器CPU和4个Instinct MI250x加速器。MI250x加速器是AMD销售的计算模块,具有2个6纳米GPU,每个GPU都配置了大量HBM2E内存,这是一种高速内存,用于存储芯片正在处理的数据,以实现快速访问。
总的来看,Frontier包含了大约9408个CPU和37632个GPU,通过专门的冷却系统对芯片进行散热,这种冷却系统每分钟流经Frontier约5900加仑的水。
相比空气来说,水的导热性更好,因此水冷系统通常比风扇更有效。HPE表示,Frontier系统不仅是全球最快的超级计算机,而且是最节能的。Frontier提供每瓦52.23 gigaflop的性能,1 gigaflop相当于每秒10亿次计算操作。
Frontier系统的芯片、机柜和其他组件通过长约90英里的电缆连接在一起,CPU和GPU由一种名为Orion的高速存储系统提供支持,该系统提供700 PB的容量,每秒可以将超过35 TB的数据写入存储,并且每秒执行超过150亿次随机IPOS。
HPE公司执行副总裁、高性能计算和人工智能部门总经理Justin Hotard表示:“今天公布的Frontier exascale级超级计算机在速度和性能方面取得了突破,让我们有机会解答那些以前甚至都不知道要问的问题。Frontier系统一套一流的系统,是技术专家、科学家和研究人员设想的、旨在释放全新能力、同时提供开放科学、人工智能和其他突破并造福人类的系统。”
据HPE称,Frontier系统帮助研究人员开发出的神经网络,其规模是此前使用早期硬件搭建的神经网络的8倍,而且人工智能训练速度将提高4.5倍。
美国橡树岭国家实验室的计算和计算科学实验室副主任Jeff Nichols说:“来自世界各地的科学家和工程师将利用该系统非凡的计算速度,来解决我们这个时代最具挑战性的一些问题。”
HPE和AMD目前正在为美国能源部开发另一套名为El Capitan的百亿亿级超级计算机,该系统预计速度比Frontier更快。到2023年推出时,El Capitan的性能将超过2 exaflops。
好文章,需要你的鼓励
IBM首席执行官阿尔温德·克里希纳表示,公司预计通过扩大AI业务规模,到2025年底实现45亿美元的内部成本节约。IBM第二季度营收达170亿美元,同比增长8%。生成式AI业务规模已超75亿美元并持续加速增长。尽管外界担心AI业务可能冲击公司其他板块,克里希纳强调AI技术的融入使IBM产品更具竞争力,咨询业务也因客户对AI转型项目的需求而受益。
普林斯顿大学研究团队开发出"LLM经济学家"框架,首次让AI学会为虚拟社会制定税收政策。系统包含基于真实人口数据的工人AI和规划者AI两层,通过自然语言交互找到最优经济政策,甚至能模拟民主投票。实验显示AI制定的税收方案接近理论最优解,为AI参与社会治理提供了新路径。
面对日益复杂的网络威胁和混合IT环境,HPE提供全面的数据保护解决方案组合。通过网络弹性、高性能恢复和集成生态系统,HPE确保从本地到云端的全环境数据安全。解决方案涵盖HPE Alletra存储、Zerto软件、StoreOnce备份设备等产品,采用多层零信任架构,帮助企业应对勒索软件攻击、基础设施故障和合规挑战。
南开大学研究团队提出了一种新的3D高斯泼溅重光照方法,通过在高斯原语上直接编码离散化SDF值,避免了传统方法需要额外SDF网络的问题。该方法设计了投影一致性损失来约束离散SDF样本,并采用球形初始化避免局部最优。实验表明,新方法在保持高质量重光照效果的同时,仅需现有方法20%的显存,显著提升了训练和渲染效率。