扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
近日在湖南长沙举行2009年高性能计算学术年会可算是中国最高级别的HPC年会,而每年在会上公布的中国HPC系统TOP100排名也让世界高性能计算相关机构愈发关注,其中包括了TOP500以及Green500的专家学者,而作为全球乃至中国HPC系统处理器的主力供货商英特尔公司也积极的参与到中国的HPC建设中,在得到全球TOP500中近80%的市场份额以及中国TOP100约77%的市场份额后,我们有理由相信英特尔在这一领域的判断与分析,将会对未来HPC的发展产生相应的作用,而中国TOP100的发起人之一,TOP100榜单的撰写者,中科院软件所并行计算实验室副主任、国家863”高性能计算机评测中心”技术委员会委员张云泉博士也有着自己的感慨与认识。在本次大会期间,记者们就HPC技术发展以及中国HPC的现状与未来展望等相关问题与张云泉博士、英特尔公司高性能计算高级系统架构师David Scott先生、英特尔(中国)有限公司亚太客户响应团队技术经理何万青博士进行了探讨。
受访嘉宾(左起):英特尔公司高性能计算高级系统架构师David Scott先生,中科院软件所并行计算实验室副主任、国家863”高性能计算机评测中心”技术委员会委员张云泉博士,英特尔(中国)有限公司亚太客户响应团队技术经理何万青博士
内存变革、来自IBM Power的竞争以及Larrabee
在本次大会上,来自中国国防科技大学的专家提到了存储墙的问题,认为在未来的HPC系统中,对于数据访问的I/O问题将成为系统性能提升的一个瓶颈,而在David Scott的发言中也提到了数据带宽的重要性。在一个HPC系统中,与CPU关系最紧密的就是内存,在当前的主要的数据传输标准中,也只有内存不是串行的,包括PCI-E、AMD的HyperTransport总线,英特尔的QPI总线、硬盘用的SATA和SAS总线都是串行的,而串行内存的主导厂商Rambus也一直跃跃欲试想重回企业计算市场,毕竟其主推的XDR内存可以达到5GT/s的速率,而现在DDR3的最高速度只有1600MT/s(Nehalem只用到了1333MT/s),所以就英特尔而言,如何看待串行内存重返HPC市场这一问题呢?
“英特尔的确尝试过串行内存方案,”David Scott表示,“早前我们推行的FB-DIMM就是一种串行内存方案,当然并不是完整的串行设计,所以在一些方面表现不佳,比如功耗和发热问题,这让我们最终放弃了它。”对于未来的发展,David Scott并没有给出明确的信息,“我完全赞成你的看法,很多数据传输都已经是串行化了,我相信内存最终也会像这个方向发展,但在很长的一段时期内,我相信还将是以DDR3为主,这是目前英特尔的基本战略。”
现有Xeon 7xxx的接班人,Nehalem-EX的架构图,相较Nehalem-EP(至强5500)有了明显的扩展它虽然采用了FB-DIMM2架构,但内存DIMM仍然是纯DDR3 DIMM,与FB-DIMM完全不同)
英特尔无疑是HPC市场上处理器的霸主,但仍然有些势力在吸引着人们的注意力,比如IBM的Power系统,在全球TOP500排名中,占据着榜首的位置(代号“RoadRunner”),不过在中国市场上,Power系统只在TOP100中占据2%的份额,什么原因会造成这样的差距,而英特尔又如何看待这个对手呢?
David Scott表示,“Power系统也是一种出色的计算系统,但与x86分属两种不同的指令集架构,它算是IBM的传统势力。不过,从总的趋势来看,Power系统的份额一直是下降的态势,x86系统正在不断扩大的自己的份额,这与整体的生态环境有很大的关系,用得人越多,生态环境越好,反过来会更加促进这个市场的扩张。”对于Power系统乃至RISC系统会不会从HPC领域消失,David Scott笑着说道,“我相信不会,它还是有自己固有的应用领域,只要IBM不放弃,我相信就不会消失,它永远都会存在,只是份额越来越小而已。”
对于国内市场上为什么Power系统份额如此之少,与TOP500形成鲜明的对比,张云泉博士认为主要的问题还是在成本上。“比如他们的大系统蓝色基因(Bluegene)就很贵,而且是整套卖,一套就上千万,这在中国是比较难承受的,而且有些系统我们想买,他们可能不买,所以Power系统在中国HPC市场的表现主要是与IBM的市场策略有关,这也造成了基于Power的HPC市场的萎缩。”
不过,在HPC市场中,除了传统的CPU外,GPU所带来的新势力也来势汹汹,这对于英特尔来说也是一种潜在的挑战,当然英特尔也正在推行自己的GPU战略,这就是Larrabee。在美国举行的2009 IDF秋季大会上,台下的听众最想知道的就是有关Larrabee的细节,那么英特尔怎么看待GPU计算,自己又将如何去做呢?
“这是一个很有意思的问题,”David Scott表示,“GPU因其特有的架构,所以在浮点运算方面强大的能力,这一点英特尔也看得很清楚,但GPU在HPC中的应用有一个很重要的问题,就是超并行编程的问题,而英特尔所看重的是如何保护用户的既有投资,让用户的应用可以更加平滑的部署到新的系统上,而不用大量的重写代码,所以英特尔并不求快,必须等相应的开发环境成熟后,才会推广硬件平台。”对此,何万青博士补充到,“这也是我们为什么大力开发Ct编程环境的原因,就是希望能以一个统一的架构来把用户的应用串起来,用户在这个环境下可以开发出基于IA架构的小到SoC、大到HPC的应用,这对于保护用户的投资,增强用户友好性有着重大意义。”
对于Larrabee以及未来的GPU与CPU整合设计,David Scott强调,“Larrabee最初上市将是图形卡的形式,面向图形应用与游戏娱乐领域,之后英特尔才会把它融入到计算系统中,它在设计之初就考虑到了统一的IA架构。Larrabee从某种角度上说是一种众核的IA架构,而在英特尔未来CPU设计中将会引入大核心与微核心的混载架构,可以说是一种CPU+GPU的整合设计,不过这与现在的Clarkdale架构不一样,Clarkdale整合的GPU对于HPC应用没有任何的帮助,但未来将Larrabee与CPU整合后,将会体现出CPU与GPU整合后的强大威力。”
率先采用32nm工艺的Clarkdale与Arrandale集成了GPU模块,但它们对于通用计算毫无帮助
中国HPC与国际的水平差异、未来超算中心的建设
“总体上说,中国的HPC在全球处在一个不错的水平,但发展很不平衡。”张云泉表示,“这个 不平衡主要体现在应用开发的实力与HPC硬件开发的实力的不平衡,这次大会上公布了中国首台千万亿次高性能计算机,在全球来看,我们是第二 个能做出这种机器的国家,另一个是美国。所以说硬件水平已经相当不错了。在亚洲,这个成绩肯定会让日本很着急,他们也在做千万亿次的机器,可被我们抢先了。至于欧洲,很多国家并不开发自己的HPC,只是购买现成的系统,比如德国、英国等等,但法国布尔(Bull)的水平也很不错,算是欧洲少数几个比较著名的HPC厂商之一。可就HPC应用的规模和水平来说,我们的差距还很大。”
张云泉用了三个层次来比较中、美、日本/欧洲之间的HPC发展和应用状况,“美国的HPC硬件开发和HPC应用水平都很高,日本/欧洲的HPC硬件实力一般,但应用水平很高,中国则是硬件实力不错,但应用水平很 差,这基本上就是一个总体的写照。”
然而相对于硬件上开发,HPC应用的开发更为枯燥而困难,对此张云泉深有体会,“由于早期国家以及企业的重视度不够,HPC应用主要是靠购买,自主开发的很少,但是这些软件的授权费用很高,而且就算你有钱,有些高精度运算的模块人家也不卖,在某些领域,不能实现高精度运算,HPC没有意义。随着中国工业的进步,很多领域都开始注意到了HPC的重要性,但应用的开发是需要积累的 ,并不能很快出成绩。”何万青博士对此表示非常赞同,“英特尔公司也正在大力帮助中国相关的客户加强并行计算应用方面的开发能力,但一个HPC应用软件从最初的开发到最终能良好而高效的执行,基本上要经历数年的时间。”不过,在中国HPC市场上有部分应用的开发能力已经接受世界的领先水平,“比如石油勘探,气象研究等,有些公司,如东方物理等开发的软件表现都很不错,”张云泉表示,“在以往报考我这里的从事HPC行业的研究生,都不能满员,只能是报多少招多少,但现在也基本快达到了10:1的录取比例,说明了这个市场在变化, 愿意从事HPC应用开发的越来越多,我们高性能计算专家委员会也计划推出一系列的鼓励计划,并建议国家相关主管部门继续加强HPC后备人才的培养,而且培养出来了还要留住,否则没有积累就不可能开发出高水平的HPC应用。”
不过,就硬件建设方面,虽然中国的水平不差,但中国的行政特色中的“面子工程”还是一个很普遍的现象,这次天津滨海新区因为天河一号而蜚声海内外,这多少可能也给其他省市一种“启发”,那么会不会在HPC大热之余又造成过多的超算中心的重复建设呢?张云泉博士显然也有这种担忧,“的确,中国超算中心的建设模式与国外不太一样,很多行业的大干快上,都是由当地政府所引导的,而这次天津滨海新区的超算中心因天河一号的部署一举成名,也的确起到了很好的‘名片’效应。是否会形成重复建设的局面确实值得我们警惕。”
然而,张云泉更强调,不能因为怕重复建设而缩手缩脚,这其中要把握好一个度。“可能会出现某种泡沫,但泡沫之后往往也会得到更多的实惠,比如如果没有之前大规模的网络基础建设,中国的宽带应用也不会如此普及,价格也会高很多。HPC也一样,我们要在量力而理智的基础上鼓励地方发展超算中心,这其中有一个双向带动的作用。一方面,地方可以因此提形科研工业基础方面的形象,另一方面也会在招商引资中增添砝码,吸引大企业 落户,使用你的超算中心。现在的地方领导人也在讲经济效益,一个超算中心运行一天的电费就不得了,所以我们需要加强如何用好超算中心方面的引导,这个思路通了,重复建设的 现象也会得到很大的扼制。”
从上海超算中心与美国橡树岭国家实验室的HPC应用规模来看,就能体现出中国目前的差距,在橡树岭实验室,50%的应用规模集中在3万核以下,3万至4万5千核的规模占32%,4万5至9万核的规模占18%,而中国的上海超算,60%的应用只用到16个以下的核心,160核心以上的还占1%,差距十分明显
为此,张云泉以上海超算中心正在推广的科学应用规模倍增活动举例,“现在中国的HPC应用规模与国外相比,相差十分明显,所以我们更应该强调超算中心的利用而不是建设,有需求自然会建设,但如果只建设而没有需求和应用,显然就是一种浪费!”