科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航



ZDNet>服务器频道>高性能计算-zhiding>曙光:HPC竞争名次让位于应用

曙光:HPC竞争名次让位于应用

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

本次的大会上,曙光公司也作为支持厂商高调亮相,曙光公司的副总聂华也进行了主题讲演,但其主题似乎并不局限于性能的提升,而更为关注在HPC应用的普及上,体现出一个传统HPC顶级厂商未来的关注视角。会后,笔者也有幸采访了聂总,就中国HPC的现状与未来发展谈了谈他自己的看法。

来源:ZDNet 2009年11月05日

关键字:GPU 曙光 高性能计算

2009年高性能计算学术年会近日在湖南长沙举行,在这次大会上,中国正式对外公布了自己的首台千万亿次高性能计算机“天河一号”,不过它并不是出自去年中国HPC TOP 100的第一名的曙光5000A(2009年第二名)的东家曙光之手,而是中国国防科技大学的产物,在此之前业界不少人都在期待曙光公司会不会有新的举动让国人振奋,可最终的结果似乎出乎很多人的预料。而在本次的大会上,曙光公司也作为支持厂商高调亮相,曙光公司的副总聂华也进行了主题讲演,但其主题似乎并不局限于性能的提升,而更为关注在HPC应用的普及上,体现出一个传统HPC顶级厂商未来的关注视角。会后,笔者也有幸采访了聂总,就中国HPC的现状与未来发展谈了谈他自己的看法。

聂总在曙光在展台背板前留影

曙光眼中的GPU计算

本届TOP100的第一名是一台CPU+GPU的系统,因此我们也很感兴趣曙光怎么看待这样的设计与趋势,曙光自己又会怎么考虑呢?聂总表示,“首先我们很高兴中国有了自己的千万亿次高性能计算机,谁做出来的并不重要,就事情本身来说很值得庆祝。”聂总接着说到,“就CPU+GPU的架构,曙光很早以前就开始入手,并取得了很大的进展,无论是NVIDIA还是ATI都有合作。就GPU计算来说,我们认为这是一个趋势,但就GPU本身来讲,它原始的出发点并不是科学计算,就目前来看,如果要担当HPC的重任,还会存在一些问题和隐患,这一点也是我们非常关注的地方。”

“打个比方,传统的CPU就是用于科学计算,而GPU是用于图形计算,它首先要把图像按帧计算出来,然后再把每秒的帧数提高到人眼可接受的程度,但这其中如果计算量大,或者数据有些错误,我们可能看到的是卡帧现象或是马赛克,但这些对于普通的图形应用,比如游戏来说并不是什么大事。大家也都知道,高级游戏玩得卡,有些图像错误是比较常见的。”聂总举例到,“但是,对于科学计算来说,这就是一个大的问题,因为它是不允许出差错的。我们知道GPU的强项在于浮点运算,但这主要是指单精度,双精度浮点性能会大幅度下降,此外整数运算以及数据校验方面都有欠缺,这就意味着它并不能像CPU那样可以很放心的使用。尤其是在HPC中,单精度运算速度大多没有什么意义。”(编注:NVIDIA公司明年第一季度将要发布的Ferimi架构的新一代GPU将大幅度提升双精度运行性能,并加入了ECC内存的设计,但目前还没有试用报告出炉)

“这就造成了一个问题,有可能你用GPU计算,到最后的结果可能是错误的,甚至计算到途中就无法进行了,”聂总接着阐述其对GPU计算的一种担心,“而如果要保证很高的精度,其加速特性就显得并不那么的突出,并且这其中还涉及到编程优化的问题。因此我们曙光特别期盼OpenCL能早日真正的投入使用,以大大降低GPU/CPU统一编程的难度。”聂总强调到,“说到底,GPU的引入带来的是一种思维观念改变的问题。在传统的HPC构建中,思路是先保证结果绝对正确,然后再去看怎么去调优程序,而GPU应用往往是先保证最快的速度,然后再去看怎么保证计算质量,所以如果用传统的观念去使用GPU就会遇到很大的问题。GPU计算是一个趋势,但更重要的是一种新的HPC构建的理念。”

“现在业内对GPU计算有两种看法,”聂总接着总结道,“一种就是认为它极大的提高了HPC的运算性能,是一个很好的解决方案,值得大力推广,另一种则是认为GPU计算仍不成熟,有一定的风险,而且往往理论的加速性能到实际的应用中,会大幅度的下降,而同时编程的复杂度与难度则成倍上升。此外系统的效率也会大幅度下降,比如天河一号就是因为采用了GPU混载的结构,效率不到50%,虽然这在混载架构中已经做得很不错了,但与传统的纯CPU系统相比,还有不小的差距,因此曙光对待这一问题是比较慎重的,我们看得比较深入和长远,最终的目的是更可靠的为用户服务。”

国产CPU与计算性能的竞争

在以前的报道中,我们曾经提到过中国科学院与包括曙光、浪潮和联想在内的国内知名HPC厂商正在合作开发采用中国自有CPU——龙芯的HPC系统,目标直指千万亿次机,但这次首先面世的千万亿次机则是至强5500+ATI GPU的架构,那么国产CPU系统又会在什么时候出现呢?曙光自己的千万亿次机又会何时诞生呢?

“国产CPU的HPC系统一直在按部就班的向前推进,这是必须要做的事情,对此曙光很有信心,因为我们把这也看作是一份责任,”聂总表示,“不过,即使到了明年第一季度也不可能看到相关产品的出现,这是肯定的,甚至明年年底也不会正式发布。因为还有很多工作要做,从某种角度上讲,它算是一种x86+MIPS的架构,在HPC系统中并不多见。”对于前不久,在业界引起广泛争论的购买MIPS指令授权问题,聂总也谈了自己的看法,“我看一些报道说,这样的授权证明了国产CPU所谓的自主产权的失败,事实上这是不正确的认识。英特尔与AMD之间也有很多x86之间的交叉授权,那么又如何评价他们所谓的自主产权?纵观全球处理器市场,如果保证自己国家高级IT系统的自主性与安全性,在x86自主开发这一块基本上是不可能的,面临很多专利的约束,而MIPS则是一个比较合理的选择,我们其实购买的是那个MIPS兼容性的标志,它意味着可以放心的去执行MIPS的200多条指令。而CPU的架构则是自己的,这对于中国的IT自主与安全很有意义,所以说这个事情必须要去做。”聂总强调,新的国产CPU的HPC系统也将预示着一个新的生态系统的建立,这并不是一个轻松的工作。

在千万亿次机方面,聂总指出,曙光目前并不看重计算能力次上的竞争,事实上,千万亿次机对于曙光来说并不是能力上的问题,而是应用与需求的问题,这也是我们的思考出发点。“事实上,我们在推出5000A后,就一直在思考这个问题,造一个大机器并不是很困难,如何充分利用它,让用户真正能用起来,是我们更为关注的话题。”聂总就此又谈到了天河一号的推出,“对于名次上的变化,我们并不看重,有这么多优秀的厂商在中国HPC市场上的耕耘是件好事,能共同的把这个市场做大,最终让用户和国家受益。而这方面我国在HPC具体应用方面还与国外有很大的差距,这次上海超算中心就如何充分利用曙光5000A而推出了科学应用规模倍增活动,就是要推动这种问题的解决。”最后,聂总总结到,“未来曙光也将会把工作的重点放在HPC应用的推广与普及,相对的,名次上的竞争是次要的,我们肯定会推出更高运算速度的机器,但也更希望它能被充分的利用起来!”

综合评分:7.97 分
云能力:7.9 分
营业额:未公布
云服务:曙光私有云存储系统DCStor

查看更多 >>

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅ZDNet技术邮件将是您的最佳途径之一。