科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道高性能计算每秒50千万亿次 外媒称我国天河二号或将问鼎全球超算五百强

每秒50千万亿次 外媒称我国天河二号或将问鼎全球超算五百强

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

据国外媒体报道,中国或将登顶今年六月全球超级计算机五百强榜单榜首,给美国与欧洲的高性能计算领域来个下马威。值得注意的是,此次中国的“天河二号”超级计算机选择了采用专用互连机制的英特尔ceepie-phibie混合设备。

来源:ZDNetserver频道 2013年6月4日

关键字: 超级计算机 超算 天河 英特尔

  • 评论
  • 分享微博
  • 分享邮件

ZDNet至顶网服务器频道 06月04日 编译:据国外媒体报道,中国或将登顶今年六月全球超级计算机五百强榜单榜首,给美国与欧洲的高性能计算来个下马威。值得注意的是,此次中国的“天河二号”超级计算机选择了采用专用互连机制的英特尔ceepie-phibie混合设备。

从上周末开始便有传言称,中国有意冲击全球超算五百强榜首。HPCwire网站率先得到消息,并在之后的几天中继续跟进报道。

El Reg记者试图通过电话采访获得一些独家内幕,但大家对此话题均避而不谈。看来我们还是要静待本月于德国莱比锡举办的国际超级计算大会,届时将正式揭晓最新超算五百强的榜单。

外媒称我国拥有50千万亿次超算设备 或将问鼎全球超算五百强

天河二号设备的部分细节信息现已公开,但人们仍对其实际性能表示疑问。(天河即‘银河’之意。)

中国服务器供应商浪潮公司回应了HPCwire发布的抢先报道,并邀请El Reg网站在莱比锡大会上走访该公司展台并进一步讨论高性能计算方面的话题。此外,浪潮公司还发来如下的一段说明:

最新全球超算五百强榜单将于第十三届全球超算大会开幕当天发布。有传言称由广州超级计算机中心打造的天河二号此次将一举登顶,三年来继天河1A之后中国将再次拿下榜单头名。这一切要归功于中国不断发展兴盛的高性能计算产业,标志着中国在高性能计算研发及构建领域的“硬实力”已经处于世界领先水平。与此同时,以高性能计算应用与技术人才为代表的中国“软实力”也在不断攀升。全球高性能计算局势可能将发生变化。

浪潮公司最后表示目前设备正在搭建当中,而且由于存在时间延误,我们尚未得到任何进一步说明。总之,浪潮公司的声明应该属实,否则曙光及联想等厂商恐怕早就出面澄清了。

来自高性能计算观察机构Intersect360 Reasearch的分析师Addison Snell表示,他也从多个来源听到了这个传闻,并透露中国的这台超算采用了英特尔至强处理器与至强Phi x86协处理器构建的混合架构,其双精度运算性能峰值总计超过50千万亿次。

据称该设备在Linpack的Fortran并行处理基准测试中将跑出52到54千万亿次的浮点运算峰值,持续运算能力则在25到30千万亿次之间。Linpack是全球超级计算机五百强的标准化基准测试工具。

这意味着天河二号将超越于2012年11月登上五百强榜首的现任冠军“泰坦” XK7 ceepie-phibie超级计算机。作为由美国能源部发起、部署于橡树岭国家实验室的怪兽级计算设备,泰坦采用AMD 16核心皓龙6200处理器与Tesla K20X GPU协处理器组合。其CPU与GPU数量各为18688个,总计拥有560640个运算核心。

泰坦采用上一代“Gemini”互连技术,旨在将各CPU汇集成3D环状体系;GPU与CPU之间的连接则采用皓龙芯片上的HyperTransport链路。泰坦的理论性能峰值为27.1千万亿次,并于去年秋季在Linpack基准测试中跑出了17.58千万亿次的持续运算成绩。

如果这半年多来泰坦的性能没有显著提升,那么天河二号将取而代之成为新的王者——至少在欧美各国投资兴建规模更大的设备之前,天河二号的地位可谓不可动摇。

美国能源部下属的任何一家实验室都有能力利用英特尔的“Aries”互连与蜻蜓拓扑技术创建出更强大、更修养扩展性的设备。去年四月,克雷公司将Gemini与Aries互连技术以1.4亿美元的价格出售给英特尔,但仍保留Aries为其现有“Cascade”XC30超级计算机产品线效力的权利。

Aries互连技术优于Gemini XE及SeaStar2+ XT两位家族前辈,这是因为它没有采用英特尔QuickPath或者AMD HyperTransport点对点互连机制(即先将CPU彼此互连,再与SMP/NUMA系统中的主内存对接),而是通过PCI-Express 3.0插槽构建服务器节点间的连接体系。

另外,Aries还非常巧妙地将光纤与铜缆传输结合到了一起。鉴于AMD皓龙处理器坚持使用PCI-Express 2.0插槽(甚至没有预留PCI-Express 3.0),因此要求PCI-Express 3.0作为支持的Aries也就跟皓龙缘悭一面了。

Cray公司尚未在Cascade上提供对英伟达Tesla及英特尔至强Phi协处理器的支持。因此如果大家希望构建一套100千万亿次级别的XC30设备,惟一的选择就只有向其中猛塞至强E5处理器了。但这种方式的成本要比CPU、GPU混合机制高得多——其单位浮点运算成本比后者高出四倍。

Cray公司应该在去年十一月Cascade设备面世之日起就为其搭配对Tesla K20与K20X GPU协处理器以及英特尔至强Phi协助处理器的支持能力,但这样一来英特尔至强E5在高性能计算领域的销售必然遭受严重打击。另外,坦率地讲,英特尔与英伟达也没有能力生产出足够数量的协处理器产品。

说了这么多,我们的目的是分析为什么美国能源部下属的众多实验室在过去半年中裹足不前。如果预算充足,相信某些实验室会努力推出规模更庞大、性能更强劲的Cascade设备,与来势汹汹的中国超算相抗衡。

东京工业大学计算科学教授松冈聪作为日本高性能计算领域的知名专家,曾在几天前的一次技术会议上与某位中国研究人员讨论过天河二号。下图来自松冈先生在Twitter上发表的说明,其内容似乎相当慎密——不过在获得实质性证据之前,我们仍然将其视为传闻。

外媒称我国拥有50千万亿次超算设备 或将问鼎全球超算五百强 

Twitter上有关中国“天河二号”超算的细节信息传言。

由于不懂日语,上述英文由谷歌翻译提供。其中松冈先生给出的数字与预期中的100千万亿次浮点运算能力不符——据称这台由中国科技部委托打造的设备将用于空间探索与医疗研究项目。

这台“未透露名称”的设备将包含约十万块英特尔“Ivy Bridge-EP”至强E5-2600 v2处理器以及同样数量的下一代“Knights Landing”至强Phi协处理器——其预计总价约为1亿美元,还算公道。

天河二号估计将于2015年达到10千万亿次运算能力而非目前的50千万亿次,并且几乎肯定会采用将于今年第三季度上市的至强E5-2600 v2处理器。

既然处理核心还没正式上市,天河二号怎么就已经传出了Linpack基准测试成绩呢?这个嘛,我们看看过去的情况就明白了。英特尔为“Sandy-Bridge-EP”至强 E5 v1芯片制定的正式上市时间为2012年3月,但实际上该芯片早在2011年9月就已经开始销售了。因此我们有理由认为Ivy Bridge-EP组件同样会在全面推出之前先提供给特定客户——也就是浪潮公司。

如之前所料,英特尔公司拒绝对关于天河二号的任何猜测发表评论。

我们希望英特尔公司已经完成了下一代Knights Landing x86协处理器的研发工作,但需要注意的是,现在距离初代“Knights Corner”至强Phi芯片发布才刚刚过去六个月。有消息称英特尔已经准备发售这款Knights Corner升级版产品,而天河二号机也很可能以单独或混合方式使用这套新方案。

就目前来看,至强Phi 5110P拥有60个运算核心、额定浮点运算能力为1.01万亿次,采用被动式散热机制;而至强Phi 3120A则使用主动式散热机制(也就是利用风扇),57个运算核心共能带来1万亿次浮点运算能力。5110P算是更好的选择,因为它的功耗为225瓦,而不像内存更多、带宽更大的3120A那样拥有300瓦功耗。5110P售价为2649美元,比售价2000美元的3120A要贵一些。

根据传闻,英特尔公司将为Knights Corner 3000、5000以及7000系列芯片配备被动式散热机制,并将其集成于主板之上。三者都基于同样的62核心Knights Corner芯片,但在活动核心数量、时钟频率、内存容量、产品价格、封装与冷却方案等方面则有所差别。

如果要从其中选择一款可以被用于天河二号的GPU,El Reg网站认为当选者应该是核心数最多、时钟频率最高并集成在主板封装中的方案,即至强Phi 7120X(推测名称,尚未确定)。

我们很难猜测7120X x86协处理器的具体性能参数,目前也没有明确迹象能证明天河二号必然会使用该产品。不过我们大可以先做一番分析推断:它拥有62个运算核心,如果我们将至强Phi核心的时钟频率设定为1.053GHz,则仅能给整体性能带来3.3%的提升。

如果时钟频率达到1.1GHz——相当于跟3120A持平,浮点运算能力会再增加4.5%,但发热量也会随之提高。另外,如果将其封装在集成化GPU中,发热量还将进一步上升。

因此,我们可以假设英特尔与浪潮两家公司共同提出这样一套设计方案。每个7120X至强Phi协处理器都能带来7.9%的浮点运算性能增幅,这相当于提供最多1.09万亿次运算能力。(鉴于其能耗明显且大大提高了发热量,这么做似乎有些得不偿失。)

而在天河二号总计16000个服务器节点当中,每个节点配备两块至强E5 v2处理器与三块至强Phi协处理器,这意味着单靠至强Phi就能提供52.4千万亿次处理性能峰值(前提是英特尔确实按照我们之前的推断进行设计)。松冈先生表示,Linpack基准测试实际只用到了13056个节点。如果X7120与我们的设计吻合,那么单是至强Phi协处理器就拥有42.75千万亿次的惊人运算性能。

天河二号目前所使用的互连机制有些混乱,但据消息人士透露,技术人员已经选定了一套专有互连方案(具体是哪套还不明朗)。由中国政府开发并使用于天河1A上的Arch互连(或者其加强版)入选率很高。

Arch采用的核心交换机拥有160Gb每秒双向带宽,每节点跳跃延迟为1.57微秒,其总带宽超过61Tb每秒。但也有人认为设备最终将采用改进版40Gb每秒(四倍传输速率)InfiniBand网络,并认为这将进一步强化天河二号的性能表现。

美国政府很可能会由于英特尔将Aries互连技术甚至是TruScale InfiniBand纳入天河二号设备而抓狂不已,但也不可能利用政策限制互连技术向特定国家出口。

相信中国高性能计算会努力突破Arch局限、筹备龙芯方案崛起并最终推出自己的加速解决方案,以实际行动向美国的芯片业巨头证明自己的独立自主能力。

如果天河二号真的利用改进版InfiniBand代替Arch,这可能意味着Arch并不适合计划运行于天河二号的特定应用程序。但关于这些应用的具体内容,我们恐怕永远无从知晓。 

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章