科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道高性能计算GPU加速走俏 Green500渴望新测试方案

GPU加速走俏 Green500渴望新测试方案

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

每年两次的Green500榜单旨在评比出最具能源效率的超级计算设备,新一轮测试则在两大重要方面带来全新突破:第一次有高性能计算系统打破每瓦40亿次浮点运算的屏障,这也是第一次十大系统全部采用GPU加速机制。此外,排名所使用的基准测试方案非常垃圾。

作者:ZDNetserver频道 来源:ZDNetserver频道 2013年11月27日

关键字: Green500 高性能计算 SC13

  • 评论
  • 分享微博
  • 分享邮件

ZDNet至顶网服务器频道 11月27日 编译:每年两次的Green500榜单旨在评比出最具能源效率的超级计算设备,新一轮测试则在两大重要方面带来全新突破:第一次有高性能计算系统打破每瓦40亿次浮点运算的屏障,这也是第一次十大系统全部采用GPU加速机制。此外,还有第三点需要关注:排名所使用的基准测试方案非常垃圾。

GPU加速走俏 Green500渴望新测试方案
英特尔至强处理器取得十连胜,英伟达Tesla取得十连胜

在这份榜单中,衡量每瓦浮点运算能力的机制仍然是我们所熟悉的Linpack基准测试,最终结果在本届于科罗拉多州丹佛市举办的SC13超级计算大会上正式公布。作为榜单头名,来自东京工业大学GSIC中心、拥有2720个核心的TSUBAME-KFC在能源效率方面力压Green500各路英杰,但它在“只关注性能”的超算五百强排名中只位居第311位。

TSUMABE-KFC是一款特制原型机,GSIC专门创建它以研究高级冷却与低功耗超级计算课题。这台设备的设计师确实很好地完成了任务,其系统评分为每瓦4503.17百万次浮点运算(简称Mflops/W)。

单看这一数字似乎没法给大家留下太深的印象,下面我们把新任冠军与今年六月公布的上一届Green500头名进行比较。来自意大利Cineca研究中心的Eurora系统当时以3208.83 Mflops/W的成绩摘得桂冠——虽然这样的水准已经相当相当出色,但与TSUMABE-KFC相比,Eurora的能源效率仍然被对方反超40%。

对于真正痴迷于大型设备的朋友,榜单上这台来自瑞士国家超级计算机中心(简称CSCS)的Piz Daint无疑更有看头。它的每瓦浮点运算能力为3185.91(我们稍后会对此深入探讨),在本次排名中位居第四。Piz Daint也是本轮Green50十强中性能最突出的选手,其处理能力在超算五百强中达到惊人的第六位。

通过对比,我们发现在Green500中另两套排名高于Piz Daint的系统在超级算五百强榜单中都只能位列三位数开外:剑桥大学的Wilkes在Green50中名列第二,但在超算五百强中则为166;筑波大学日本计算科学中心的HA-PACS TCA在Green500中名列第三,但在超算五百强中则为134。

Piz Daint在超算五百强中的性能表现还存在另一大值得关注的要点。在今年六月的榜单中,它仅仅位列42;而刚刚过去五个月,十一月的排名中这已经窜升到第六。为什么会这样?全靠英伟达Tesla K20X GPU加速器给这台28机架克雷XSC30系统带来的推动作用。

我们还在最新Green50榜单中发现了这样一个有趣的现象:在前十位系统当中,全部选手都在使用英伟达Tesla GPU加速器;其中七套系统采用Tesla K20X卡、两套采用K20、最后一套则选择了K20M——本质上也属于K20。

相比之下,今年六月公布的上一份榜单中只有三套系统搭载GPU加速器:两套配备英伟达K20,一套采用AMD FirePro S10000。其它系统则全部选择了英特尔至强Phi协处理器卡;不过在最新的Green500榜单中,已经没有采用至强Phi的系统出现。

一切都很好,只是……

在本周三SC13大会就Green500的讨论环节中,所有与会者——包括Green参选者本身——一致认为目前的测试、评分以及排名系统所依据的科学基础并不严谨,必须进行调整。

尽管Green500确实公布了作为排名依据的能源计量测试机制,也与能源效率高性能计算工作组(简称EE HPC WG)合作通过三级方法进行了审核,但所有参与其中的高性能计算从业者都承认测试及报告规程方面还有很多工作要做。

在三级测试当中,一级是最简单、同时也是Green500入门提交的必要前提。它不仅非常简单,而且指向范围也非常有限:在一级测试中,惟一需要进行测试的子系统就只有计算系统——而不必考虑存储以及网络层面。直到二级测试后两者才会参与进来,即“全部子系统都必须参与到计量或估算当中。”

抛开在各个级别对各类子系统进行精确独立计量的难度问题不谈,技术人员还需要将测试难度尽管保持在合理的范围之内。要实现这一目标,理论上说应该是测试级别越高,Mflops/W评分也就越低——通常应该如此……

在讨论当中,来自Piz Daint诞生地CSCSThomas Schulthess坚定地认为三级测试——继续遵循二级规则并进一步提高严格程度——是惟一能够准确反映系统能源消耗的机制,相比之下二级测试只能算是勉强可用。一级测试在他的眼中完全就是在胡闹。

“我是一名接受过严格培训的物理学家,”他表示,“是瑞士联邦物理学院的一位物理专家;根据职业素养来看,我必须要计量出一个确切而值得依赖的数字。我不能接受计算出的结果是两个不同的数字或者发现系统得出两个不同的能效水平。”

SchulthessPiz Daint进行一级测试时,他获得了一个结果数字;而在运行三级测试时,评分结果更为准确而且反映出的系统能效表现比一级测试更差。这绝不仅仅是追求“确切数字”的偏执——作为物理学家,他无法接受Green500评比居然会采用一级测试这么不靠谱的机制。

Piz Daint上运行Linpack基准测试并采用三级分析机制时,Schulthess和他的团队发现得分结果为3186 Mflops/W。但在采用一级规则后,评分即飙升至3864 Mflops/W

“人们说我们应该向Green500提交得分更高的一级测试结果,”他告诉我们,“但这个结果是错误的。这个数字根本没有反映真实情况。”因此Schulthess提交了三级测试分数——尽管他的竞争对手们有权提交一级测试分数。Piz Daint最终因此获得了第四名而非原本唾手可得的第二名。

“每个高性能计算中心中的第一位系统拥有者及系统运营者都有责任公布正确的数字,”他表示。“这才是处理科学问题的正确态度,我也希望超级计算领域能遵循同样的规则。我不确定自己遇到的情况是否广泛存在,但至少我们的测试遇到了这样的问题。”

必须提醒大家,我们在SC13的研讨环节中并没有找到任何一种能够让大家认同并满意的高性能计算系统能效测试机制。相反,每一位参与者都诚挚希望尽管迎来科学新方案的出台。

Green500及高性能计算领域的活跃成员们将在未来几个月就这一难题展开争论。没有人——至少没有哪位神智清醒的技术人员——明确表示基准测试开发是件轻松的工作,我们只能静待真正可以服众的机制尽快降临。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章