扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
来源:ZDNet 2009年08月24日
重量级产品线布局明年HPC市场
8月21至22日,中国教育科研网格(CHINA GRID,下文简称CG)2009研讨会在烟台召开,作为CG的重要合作伙伴,英特尔公司也专门派出了重量级嘉宾——英特尔公司服务器平台事业部高性能计算业务总经理Richard Dracott先生以及英特尔公司千万亿级产品线架构师David Scott先生——向与会者传递了英特尔在HPC领域的最新动态,以及未来的产品布局。
Richard Dracott介绍到,三年半前我们重建了这个部门,原因是把英特尔内部所有和高性能计算的相关资源全部统一起来,这个部门全球有差不多250个员工,这些人分布在软件、硬件、平台各个方面。成立这个部门的原因就是把所有这些资源全部集中,服务于高性能计算这个行业。
英特尔公司服务器平台事业部高性能计算业务总经理Richard Dracott先生
Richard Dracott很快就把话题转到了并行开发与新一代的至强5500处理器上。在软件方面就是全新的整个套件——Parallel Studio,它包括了英特尔公司自己的编译器、函数库以及MPI库。而至强5500处理器显然是今年英特尔的明星产品。Richard Dracott表示,“在今年的6月份的Top500里面我们占了80%,4核有2/3的份额在整个榜单里,最重要的一点是Nehalem差不多三月份发布,只有两个月时间,就有33套(基于这个处理器的系统)进入TOP500,其中有两套在Top20里,一套是在欧洲的juelich,还有一套是在加拿大的SciNet,欧洲这套最重要的是排Top500的第10,但是在欧洲是第一。最重要的是,虽然这两个在Top1或者Top2,但是最重要的是一套的效率是90%,另一套是65%,这在千兆以太网里非常非常高了。去年年底发布的中国TOP100,英特尔是74%,前10名里面9套是英特尔的。”
至强5500相对于至强5400,在部分HPC应用测试中的对比,如果将至强5400的成绩作为基准的话,至强5500的性能提高达到了2-3倍,Richard Dracott表示,从历史来看基本上,如果这一代比上一代提升到45%-50%就已经非常成功了,但是今天我们提升了两倍到三倍是非常巨大的成功。相信这也是至强5500能在3个月的时间里迅速进入TOP500强并取得33个席位的重要原因
在谈到全球与中国的HPC应用趋势时,Richard Dracott发表了自己的观点,“高性能计算在全球的主要行业应用和中国略有不同。从商业角度来说制造、金融,华尔街是英特尔非常大的高性能计算的客户,包括气象预报,在科研领域无论是制药还是科研研究也都应用了高性能计算。从我的角度来看,在中国这两天一直在见客户,中国除了石油、气象包括基因研究,现在已经看到的一些应用。我认为中国未来很大的一块发展会在制造,随着纯制造到设计,举一个例子,在经济低迷的时候,如果走过这一段时间,很多公司会意识到自己做产品的时候怎么更加提高效率。比如碰撞模拟这块以前是飞机、汽车制造厂在应用,现在连手机制造厂已经在用,来模拟像手机掉在地上会是一个什么样的结果。”
而在进一步帮助用户提升HPC方面,英特尔也不仅仅只有CPU一个硬件产品。
英特尔在HPC领域里所能提供的硬件不仅仅是运算平台,还包括了更快速的I/O设备,这就是SSD,根据测试,配置了SSD的至强5570的HPC系统性能还会进一步提高,尤其对那些I/O敏感的应用,英特尔的SSD战略将能很好的帮助用户进一步提高整体的运算性能
在介绍完至强5500的战绩以及SSD之后,Richard Dracott谈到了未来的产品布局,而从英特尔在企业级运算平台上的战略,在未来我们将看来三路并进的态势。
现有的双路主流市场,在今年由至强5500取得辉煌胜利之后,明年将由6核32nm工艺的Westmere-EP接班(型号将为5600系列),四路及以上服务器目前仍然是7400系列掌管,而到明年第一季度将由8核的Nehalem-EX代替(型号将为7500系列),它还将拓展出8路服务器产品线,厂商如果有实力还可以自行开发16路服务器,借助于QPI直联架构,这要相对以前要容易得多。最后一个就是面向RISC替换市场的安腾系列,明年将推出代号为Tukwila的第三代安腾
那么有了如此强大的后继力量,尤其是面向4路、8路服务器的Nehalem-EX上市之后,采用这种“大系统”的HPC性能是不是也将会大幅度的提升呢?Richard Dracott就此开始了对TOP500榜单历史的分析。
中间的红点线是TOP500里面第一名的走势,下面的粉点线是Top500里最后一个走势,最上面的绿点线是整个Top500计算容量总和的走势,最下方的红线是摩尔定律所划定的发展趋势
Richard Dracott表示,“上面这三条线有一个特征,即“可预期”,三条线都往一个方向走,而且平行度差不多,基本上他们的发展方向是一致的,只有第一名有一些波折,因为它有时间差,会突然出来一个大的。如果按照摩尔定律来看,摩尔定律是发展最新的技术,永远是可预期的。摩尔定律发展带来的性能和今天的Top500性能带来结果有巨大的差距。原因在于高性能计算对性能需求无止境的,另外系统越建越大,速度已经超过了摩尔定律。所以,大系统带来最大的一个问题就是能耗,而不是空间,空间只是其中一个问题,但是最大的问题是能耗。这三条线的趋势有可能还会继续往前走,如果现在一年的能耗要花百万美金,随着高性能计算系统再往上发展,可能以后会达到上亿级的电费,以后技术的发展一定会超过现在摩尔定律的速度。”另外,他还强调一点,“如果看中国TOP100的线,那画的比这个陡多了,发展速度远超过。”
Richard Dracott的主要观点在于,大系统的性能更高了,但其能耗也将更为惊人,因此英特尔的一个重要的任务也是在于如何更有效的控制能耗的提升,提供性能/瓦特的比率。
英特尔希望能从多个角度下手,包括生产工艺、新技术采用(如SSD)、更小的外形(如半宽小主板)、更智能的能源管理以及数据中心的革新,来实现每年提升50%性能/瓦特比的目标
Richard Dracott最后表示,“高性能计算计算,在全球也好、在中国也好都是高速增长的机会,甚至在今天经济不景气的情况并没有受到太大影响,而且中国的增长速度高于全球。从英特尔的角度来说高性能计算是非常重要的,无论是新技术的演进还是跟行业客户的配合都非常重要。我相信,至强5500在2009年肯定是高性能计算里非常重要的产品,明年Nehalem EX肯定会改变整个大的集群节点的格局。”
答记者问:我喜欢HPC这个产业
在介绍会最后,Richard Dracott以及David Scott先生还共同回答了记者们感兴趣的问题。
问:我比较关注的是Nehalem EX,它会不会是英特尔在大系统的一个发力点,不知道Richard Dracott怎么看这个问题?
Richard Dracott:今天市场中能提供“胖节点”的厂商并不多,“胖节点”在高性能计算集群里的应用也并不多,有POWER、SGI的、还有安腾,今天Nehalem EX一个最重要的改变就是可以非常容易的帮助我们厂商造一个8路的节点,就是说8路制造起来非常的容易,门槛低了。会有非常多的人造8路Nehalem EX,正是因为这一点在未来高性能计算计算当中可以看到胖节点的比例会增加,但还不会是主流。首先,要看应用,这个应用要适合大内存容量的应用,这也是胖节点的一大优势,胖节点另外的好处就是减少网络连接的端口数量。因为用“胖节点”,你的节点数量少,实际上操作系统的数量、进程的数量就会少,相对来说更加的稳定。
问:我关注到,从安腾9100发布以后到现在,在安腾上的HPC数量几乎上没有变化,这里就会有一个问题,这两年这些安腾客户是转向至强的架构了呢,还是因为Tukwila一直没有发布,因为他们没有办法只有等待,因为我们知道HPC也要做一些转换平台的事情实际是非常困难的事情。
Richard Dracott:就算Tukwila没有延期,也不会认为安腾在TOP500和TOP100增长会非常快。安腾今天转向至强是一个必然的趋势,原因是因为,过去很多人用安腾,是在那个阶段安腾浮点计算性能是远远领先于至强的,今年随着至强浮点计算性能大幅度的提升,所以一定是构建越大的系统时更多的人会选择至强。安腾未来的方向,今天英特尔在安腾整体方向是在企业级应用,从全球来看今天安腾在企业级应用里,从我们的竞争对手这边赢回市场份额会越来越多。
问:在英特尔看来高性能计算主要用于什么领域?哪些领域它的需求最迫切?如果这些领域已经用到了高性能计算,如何把计算力转化为生产力。如果还没有用,你认为阻碍这些企业或者领域应用高性能计算的主要原因是什么?
Richard Dracott:如果说是什么在驱动整个中国高性能计算市场的话,从历史来讲一定是科研领域,无论在化学、气象,包括流体(力学)各方面,在商用领域中,最重要的驱动中国商用高性能计算的市场就是石油石化,除了这两个之外,制造业是未来中国巨大的机会,随着中国从单纯的制造向制造加设计方向的演变,一定会用到高性能计算。随着制造产业的格局的改变,高性能计算在制造领域是一个巨大的机会。同时,还有一些现在的新兴市场机会在中国,就是生物科学以及动漫,这两块是我现在看到中国成长非常快,虽然目前还是一个“新兴市场”,但是未来会增长很快。从我的角度认为,理论上来说并没有什么真正的东西可以阻碍在中国更快的增长高性能计算,只要技术是就绪的,本地有解决方案,同时是整个行业可以认可高性能计算带来的无论从设计还是生产制造方面的高效率,所以高性能计算会增长越来越快。
问:能否谈谈全球市场在这方面的情况?
Richard Dracott:从全球来看,全球过去几年一直保持一个两位数的高速增长,过去一直是这样。去年的确是有所下降,去年随着经济不景气确实下降了,受到比较大的影响是在商用领域的高性能计算,但是,从今年和很多客户见面来看,这种需求慢慢又回来了,最重要这个需求是永远存在,通过经济低迷的事情来看,更多的用户想看高性能计算作为一个性价比非常好的工具,怎么帮助它面对经济低迷的时候出现一个转型。换句话说,就是怎么支持生产更加高效,从全球各个地区来看,和中国唯一不一样的地方是,全球其他地区很多小的制造企业已经大规模的开始采用高性能计算,但是在中国还没有看到这个趋势。从新兴市场来看,也是一样的,在全球也是生物科学和DCC增长非常快的。
问:刚才提到商业应用这块,国内很多像行业用户,比如说制造业,可能一上来不会用这么大的计算集群,现在提到个人HPC这块,国内有很多的厂商做这块内容,请问Richard Dracott对个人HPC国内的发展情况怎么看。
Richard Dracott:从我过去的经验来看的一个趋势,一般他们都会采用工作站,在从采用工作站转移到真正的集群当中会有一个非常艰难的路,这条路要走过去,在路的过渡过程当中个人高性能计算如果未来成熟的话,可以起到一个作用,就是在工作站和集群之间作为一个转移的中转站。美国大批量工作站都采用Windows,从Window转到Linux是有一定的困难,因为HPC应用大多是跑在Linux系统上的,但如果工作站过去的应用是基于Linux,到Linux会稍微容易一些。现在所谓个人高性能计算基本上到4-16个节点,当然要考虑噪音的问题、电源接入的问题,可以接入普通的墙电,放在你的脚边,当然最重要的不是硬件,驱动整个个人高性能计算关键是软件,就是有没有软件可以跑在个人高性能计算上,让用户可以真正用起来,把中间的过渡期用过去才是最重要的,而不是硬件,硬件很容易。
问:AMD近期发布了一个OpenCL for CPU的SDK,我们知道OpenCL在CPU和GPU计算之间做一个协同的编程环境,英特尔怎么看待现在AMD的这个动作,OpenCL未来对高性能计算会有哪些潜在的影响?
Richard Dracott:这个问题还是回到GPU这个事情,如果回顾历史去看的话,任何在加速卡上成功的一些东西,如果它的真的成功,成功到大的市场里面去,英特尔干脆把它放在处理器里面去。所以很简单的一个道理,任何一个东西在小众市场上获得了巨大成功,走向批量市场,为什么不把它放在CPU里面去呢?历史已经证明了。但对于GPU今天的GPU最大的几个问题:一是在于数据之间的传送,也就是说光考虑计算不行,必须要把数据传送考虑进去,这一点GPU还有很长的路要走。二是开发软件的复杂度方面,涉及到客户最后的投资回报,我跟很多商业客户做交流的时候,商业客户反映是这块投资回报率太差,就是说客户对于加速比的期望值,由于它的过去衡量方式不对,在英特尔进去做了很多调优之后,会发现原来号称几十倍,结果调完只剩下几倍,这种情况下客户会衡量只有几倍提升,我是否要做大量的代码转移工作或者重新编译工作,客户会衡量真正的投资回报,这对于商业客户是非常重要的。我认为这场游戏最终结束就是软件之争,根本不是硬件之争。英特尔观念是客户软件代码的投资才是重中之重,而不是其他的东西。如果你是一个客户,今天你开发了一个代码,代码是你的核心价值,如果你一会儿转到这个平台上,今天看英特尔的平台好,又转回来,回头看它的好,又转回去,这是不可能的。这就是说,任何一个新架构想要获得成功,最大的一个瓶颈阻碍就在于软件的接受度。
问:刚才您提到有一个最大的团队帮助ISV做优化,能否介绍一下这方面的情况?另外,您认为单个机器的性能最后变得越来越大,最后会带来一种什么样的问题呢?
Richard Dracott:英特尔历史上一直做这件事情,就是任何新架构产生之前,背后的整个软件团队都在支持这些ISV,我们的支持方式是利用我们的软件工具,让这些ISV用到我们的软件工具,无论是便于提出函数库还是调优工具,在新的平台上把这个性能充分的发挥出来。我们差不多有70个人负责跟核心的ISV打交道,我们有两种支持方式,一种是支持商用高性能计算里面的重要的商用ISV,另外一种除了大的商用ISV之外,全球还有一些超大的客户是开发代码,自己开发代码不是商用软件,但是英特尔也支持这些最重要的客户。基本上这些所谓的重点的客户在美国也支持过像金融领域、石油石化领域,这里边都是很多自己开发的代码,在中国同样,中国对于本地的最重要一些大的高性能计算的ISV,像石油石化领域当中我们本地有一个团队也是专门支持他们自己软件代码的性能调优。
对于大系统有几点,第一驱动力是百分之百存在,那条线还会继续往前走,一方面是大家还需要更大的系统提升更强的性能。另一方面,为什么我非常喜欢自己这份工作,因为我的客户买完一个大的以后会说我明年还会要一个更大的(笑)。例如一个汽车公司,所谓高性能计算的需求永远存在,做汽车制造或者做流体动力学风力模拟,所有这些领域用计算机模拟去做,当然成本差异非常巨大,这就是为什么我的客户永远有一个无止境的需求要买机器,其实机器越大就带来更大的挑战。第一,怎么让密度越来越高,因为系统越来越大,无论从空间角度还是单机柜散热的角度,可能都要考虑,第二个就是说怎么能够在把密度做的越来越高的同时,解决单机架高密度散热的问题。另外,今天在数据中心层面,大家考虑的最大的问题,对于高性能计算挑战最大的问题就是为了计算所付出的能耗和这些计算设备散热需要把散热方面消耗能耗做一个比的话,就是我们PUE比,现在全球的普通数据中心PUE比都是2:1,我认为英特尔今天已经有能力帮助我们的客户做到1.25:1,这是非常容易做到的数字,那就意味着把更的能耗放给计算,而不是把更多的能耗浪费在散热方面,这是一个非常重要的问题。当然,我认为虽然PUE比例的提升,自然而然密度就会提升,因为同样的空间内你可以放入更多的机器。
问:刚才讲能耗的问题,和实际用户接触的时候,性能和功耗发生矛盾的话,比如大部分用户是不是会更关注性能,你刚才提到未来英特尔有一个目标就是希望每年能够提高能效50%,这样一个比例是否能够满足未来高性能性能的发展同步?
Richard Dracott:50%有可能刚才时间原因没有说的太细,50%的提升是从整个数据中心的来说,而不光指一个部件,英特尔要和数据中心层面合作伙伴打造这个指标。
其实最重要的观点,如果看性能功耗比在一个高性能计算当中必须要从整个系统的级别去看,光看单节点级别没有意义。为什么呢?因为高性能计算客户更多的看到一个情况,就是每个高性能计算客户一定在单节点里面性能要达到最高化,原因在于每个高性能计算用户做计算的时候已经知道自己需要一个多大的计算规模,比如100T,同样达到100T,单节点性能越高,使用的节点数量就越少,节点数量越少,网络设备、各方面的设备都会少,这样虽然单节点能耗是高的,但是整个系统能耗在同样达到100T时,整个系统能耗使用CPU越高的,节省的系统能耗越多,这就是为什么高性能计算用户一定是单节点性能越高。
David Scott:我和很多客户聊天的时候,发现当谈到性能功耗比的时候最大的挑战是买超算机器的人和建大厦的人和付电费的人以及管理整个IT数据中心的人其实很多时候都是不一样的。最大的问题他们并没有全部整合在一起看性能功耗比的问题。我碰到很多的客户,第一个跟我提出要做这么大的计算容量,但是远远没有考虑他需要匹配什么能力,来提供真正能够应付这么大的计算能量。我看到很多客户都是先要性能,等到性能大到整个基础设施承受不了的时候,自然就会转去性能功耗比。