科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道高性能计算是什么撑起了美国能源部的两台超级计算机?

是什么撑起了美国能源部的两台超级计算机?

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

在2014年11月,美国能源部宣布IBM和NVIDIA中标其“高峰(Summit)”和“峰峦(Sierra)”两台超级计算机的那一刻,相信IBM笑了、NVIDIA也笑了。说IBM笑更多是因为终于能缓口气了,伴随云计算、大数据以及移动互联网浪潮的迅速来袭,过去两年IBM业绩呈现出持续

作者:于泽 来源:ZDNetserver频道【原创】 2015年1月30日

关键字: NVIDIA 超级计算机 Power NVLink

  • 评论
  • 分享微博
  • 分享邮件

ZDNet至顶网服务器频道 01月30日 新闻消息(文/于泽): 在2014年11月,美国能源部宣布IBM和NVIDIA中标其“高峰(Summit)”和“峰峦(Sierra)”两台超级计算机的那一刻,相信IBM笑了、NVIDIA也笑了。说IBM笑更多是因为终于能缓口气了,伴随云计算、大数据以及移动互联网浪潮的迅速来袭,过去两年IBM业绩呈现出持续下滑的态势,此次拿下能源部大单无论是对于IBM本身还是提升客户信心都有着十分积极的意义。而说NVIDIA笑则是因为,利用NVIDIA技术打造的超级计算机极有可能夺回HPC TOP500榜单的首位。为什么说极有可能,是因为美国能源部的这两台超级计算机在2017年才会交付,这两年是否还会有更牛的超级计算机,现在断言还为时尚早。 

为了让大家更直观地了解这两台超级计算机的性能,我们在此做个简单的对比。根据美国能源部现有的规划,“高峰”系统将于2017年安装完毕,预计性能将达到150~300PetaFLOPS,“峰峦”的预计性能将超过100PetaFLOPS。而当今世界上最快的超级计算机来自我国的天河二号(Tianhe-2)的峰值性能为55PetaFLOPS。如果“高峰”和“峰峦”能够如期交付,其性能相比现在确实能再上几个台阶。

撑起“高峰”和“峰峦”的三项技术 

能有这样的性能,可以说离不开NVIDIA与IBM共同研发的多项创新技术,今天我就来聊聊和那两台超级计算机十分密切的技术和产品,主要包括3个关键词:POWER9、Volta和NVLink。 

其中POWER9是IBM下一代POWER处理器,关于其更多细节现在还无从得知,不过从POWER8来看,除了在性能、可靠性、可用性等方面表现优异外,在数据分析方面也有着突出的表现。Volta则是NVIDIA下一代GPU架构,虽然现在还看不到其具体的设计细节,但据NVIDIA 解决方案工程架构副总裁 Marc Hamilton介绍,Volta将实现比Pascal(帕斯卡)更高的能效、更强的性能和更便捷的编程。 

是什么撑起了美国能源部的两台超级计算机?

NVIDIA 解决方案工程架构副总裁 Marc Hamilton

如果把POWER9和Volta看成两个孤岛,那NVLink就可以理解为连接两个小岛的海底隧道,有了这条隧道,两个孤岛之间就能进行有效通信。当然,这只是个比喻。准确地讲,NVLink是一项能够在GPU与GPU、GPU与CPU之间实现高速大带宽直连通讯的快速互联机制。按照Marc的说法,NVIDIA内部将其认为是一种新的、高速的、节点内的互联技术。简单理解,NVLink要解决的就是GPU之间、CPU与GPU之间的内部通讯问题。这一点就如同多路服务器的研发厂商要解决多个处理器内部的通讯问题一样,因此具备这样的能力一定程度上也证明着自身的研发实力。 

那NVLink究竟有着怎样的能力?首先NVLink并不依赖于PCIe技术,根据NVIDIA官方给出的数据,NVLink的速度可以达到目前PCIe总线速度的5~12倍。虽然在这里笔者多次提及到PCIe,但NVLink其实与PCIe并不相同。Marc在接受采访时就表示,“如果说你仅仅把NVLink看作是又一个PCIe,我觉得并不是非常的公正。因为至少从以下两点来看,NVLink和PCIe是非常不一样的,第一点就是在能效方面,NVLink相较PCIe,至少可以实现两倍的单位能效。第二点就是在使用NVLink技术后,可以实现在CPU和GPU之间缓存的一致性。” 

简单总结Marc的解释,就是NVLink与PCIe有些相似,但又有很大的区别。相似在于二者都是一种传输技术,所要解决的问题也是各个部件之间的通信问题。所不同的在于,NVLink的性能更高,而且NVLink还有一招杀手锏就是GPU与CPU之间的缓存一致性技术。什么叫缓存一致性,就是CPU可以直接访问GPU的内存、而GPU也可以直接访问CPU的内存。这么做有啥好处?首先,双方可以直接访问对方的内存意味着很多任务不必再经过对方,减少一道手续意味着更高的效率。其次,己方内存不够用时能够借用对方资源,可大幅提高资源利用率。 

NVLink普及还有一段路要走 

在此,笔者不再一一列举NVLink所能带来的提升。不夸张地讲,这项技术一定程度上有着跨时代的意义。这时或许有人该问了,按你说的这么牛,这项技术一经推出就该普及了,怎么到现在还是IBM和NVIDIA两家在玩?确实,你说的没错,单纯就技术层面而言,NVLink可以说已经迈入了下一个时代,不过结合许多其他因素,NVLink要想获得广泛普及,还需要做很多工作。 

首先,NVLink所要面临的就是平台的局限性,Power平台如今的处境想必大家都知道,不能说日暮西山,但说其每况日下其实也不算夸张。为此IBM在2014年彻底开放了Power,成立了OpenPOWER基金会,而NVIDIA正是该基金会核心成员,成立了中国Power技术产业生态联盟。但即便如此,就如同x86架构经过十几年的发展才到今天的局面一样,Power要想重回巅峰也不是短时间能做到的,所以依靠Power平台来推广NVLink其实并不太靠谱,起码是在短时间内。 

对此,NVIDIA有着充分的考虑。在对Marc的采访中,他就表示,“NVIDIA是OpenPOWER基金会的一个成员,而NVLink是OpenPOWER基金会技术当中的一部分,所以其实NVLink不仅仅适用于IBM,同样适用于其他成员。”当然这里有一个前提就是上文提到的OpenPOWER基金会要实现快速良性地发展。 

除此之外,据Marc介绍,目前NVIDIA也在同一些研发生产64位ARM处理器的厂商展开合作。根据NVIDIA的规划,在其Pascal和Volta架构的生命周期内,会有一些研发64位ARM处理器的厂商采用NVLink这项技术。 

不难看出,NVLink还是十分看重与其它平台之间的合作的,尤其是Power平台,这其中有同处OpenPOWER基金会的原因,当然也透露着些许无奈,因为NVLink几乎不可能推向如今广泛普及的x86平台。一是因为NVLink本身对于PCIe是个很大的威胁,二则因为即便在HPC市场,其GPU与英特尔的Xeon Phi协处理器也打得不可开交。 

文章写到这,原本该告一段落,但Marc的另一段话让笔者重新思考了起来。他说,“即便是没有处理器直接支持NVLink技术,纵使只是在GPU之间来使用NVLink,同样可以带来很大的好处。” 

笔者更愿意讲这理解为NVIDIA的一种底气,即便没人用,我自己也足够撑起一片市场,这一点相信大家是认同的,毕竟NVIDIA在图形计算领域有着绝对的市场优势。而与此同时,GPU计算的应用范围也在不断扩大,比如在大数据、数据分析领域。据Marc透露,未来NVIDIA与IBM将在数据分析领域展开更深入的合作,而IBM已经宣布计划将其数据库迁移至GPU之上。 

是什么撑起了美国能源部的两台超级计算机?

NVIDIA 副总裁及PSG&云计算业务总经理 Ashok Pandey(潘迪)

前边叙了这么多,可能有人该问了,NVIDIA的这些技术何时能落地中国?在采访中,NVIDIA 副总裁及PSG&云计算业务总经理 Ashok Pandey(潘迪)向笔者详细介绍了NVIDIA面向中国的战略,主要是分为三个层面,即应用和技术、合作伙伴以及软件+服务。一是以应用和技术来带动。应用层面,主要包括科学计算、分子动力学等。技术层面,NVLink就是一项非常重要的技术,NVIDIA会向合作伙伴和用户推广这项技术。同时,也会与像ARM、OpenPOWER、Power中国技术产业生态联盟这样的组织合作,以更好地推广相关技术。其次,NVIDIA会跟中国的包括浪潮、曙光、华为、联想等合作伙伴一起成长、一起配合,加速NVIDIA应用以及技术战略的实现。另外,NVIDIA在转型,在做一个平台化的公司,这其中软件+服务是非常重要的,我们现在也在积极地把我们的一些软件,加上我们CUDA的企业服务带入中国。 

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章