作者:MARIA DEUTSCHER
更新时间:美国东部时间2023年11月14日14:15
Top500 计算组织再次将 Frontier 评为世界上速度最快的超级计算机。

安装在橡树岭国家实验室的Frontier是一个拥有9,472台服务器的系统。在本周一公布的最新一期超级计算机榜单中,Top500将其评为全球最快的高性能计算系统。这一结果是在本周于丹佛举行的“超级计算 2023”行业盛会上发布的。
Top500采用了一种名为HPL的基准工具对超级计算机的性能进行比较。该工具让机器求解线性方程组来评估机器的速度,然后测量机器完成任务的速度。计算使用了以float64格式存储的数据,这种格式用于表示长分数。
去年6月,Frontier首次夺得Top500榜单的第一名。当时,这台超级计算机的性能为1.102 petaflops,相当于每秒计算约110万亿次。此后,它的速度提高到了1.194 exaflops。
Frontier由部署在74个液冷机柜中的9,400多台服务器组成。每台服务器配备了五个AMD公司的计算模块:一个中央处理器和四个I250x加速器。每个MI250x包含了两块显卡。
Frontier不仅在超级计算性能方面创下了记录,而且在能效方面也很突出。该系统在Top500的基准测试中达到了1.194 exaflops的性能,耗电量为24.69兆瓦。这比榜单上第二强大的系统——阿贡国家实验室最近部署的Aurora系统的耗电量少了约两瓦。
Aurora系统的硬件组件安装工作已于今年早些时候完成,但尚未完全投入使用。该系统在 Top500的测试中表现出的585.34 petaflops性能约占其预期计算能力的四分之一。一旦其所有组件都投入运行,Aurora的处理能力将超过2 exaflops。
与目前的Top500记录保持者Frontier一样,Aurora也是由慧与公司制造的。 但它采用的是英特尔而不是AMD的处理器。Aurora的10,000多台服务器拥有21,000个CPU和60,000个GPU,在进行最新的Top500速度测试时,大约运行了一半的CPU和GPU。
排名第三的是微软公司最新推出的名为Eagle的超级计算机。该系统托管在该公司的Azure云平台上,速度达到561.2 petaflops。它采用了英特尔的CPU和英伟达的H100显卡。
在 Eagle上线之前,Top500榜单上排名第三的是一个名为Fugaku的系统。Fugaku由日本Riken 计算科学中心运营,是排名前五的超级计算机中唯一采用基于Arm plc处理器蓝图CPU的系统。该系统拥有不少于 158,976个基于Arm的处理器,分布在大约400个服务器机架上。
继 Frontier、Aurora、Eagle和Aurora 之后,世界上第五快的超级计算机是位于芬兰Kajaani 的LUMI系统。它也出自慧与公司之手。LUMI采用了数千个64核的AMD CPU 和该芯片制造商的Radeon Instinct系列显卡。
最新的Top500排名是AMD公司的一个重要里程碑。在上榜的500台超级计算机中,约有140台采用了这家芯片制造商的CPU,比去年同期增长了39%。很快,又将有一台采用AMD处理器的系统进入该榜单:美国能源部即将推出的 El Capitan超级计算机预计将在明年上线,提供超过 2 exaflops 的性能。
好文章,需要你的鼓励
2025年,企业技术高管面临巨大压力,需要帮助企业从持续的AI投入中获得回报。大多数高管取得了进展,完善了项目优先级排序方法。然而,CIO仍面临AI相关问题。支离破裂的AI监管环境和宏观经济阻力将继续推动技术高管保持谨慎态度。随着AI采用增长的影响不断显现,一些CIO预期明年将带来劳动力策略变化。
这篇论文提出了CJE(因果法官评估)框架,解决了当前LLM评估中的三大致命问题:AI法官偏好倒置、置信区间失效和离线策略评估失败。通过AutoCal-R校准、SIMCal-W权重稳定和OUA不确定性推理,CJE仅用5%的专家标签就达到了99%的排名准确率,成本降低14倍,为AI评估提供了科学可靠的解决方案。
FinOps基金会周四更新了其FinOps开放成本和使用规范云成本管理工具,新版本1.3更好地支持多供应商工作流。该版本新增了合同承诺和协商协议数据集,增加了跨工作负载成本分摊跟踪列,以及云支出和使用报告时效性和完整性的元数据可见性。随着云和AI采用推动企业IT预算增长,技术供应商正在关注将成本与价值联系起来的努力。大型企业通常使用三到四家云供应商,小企业可能使用两家,同时还有数据中心、SaaS和许可等服务。
NVIDIA团队开发出Fast-FoundationStereo系统,成功解决了立体视觉AI在速度与精度之间的两难选择。通过分而治之的策略,该系统实现了超过10倍的速度提升同时保持高精度,包括知识蒸馏压缩特征提取、神经架构搜索优化成本过滤,以及结构化剪枝精简视差细化。此外,研究团队还构建了包含140万对真实图像的自动伪标注数据集,为立体视觉的实时应用开辟了新道路。