科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航



ZDNet>服务器频道>高性能计算-zhiding>英特尔:走自己的HPC之路——让客户去选择!

英特尔:走自己的HPC之路——让客户去选择!

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

近日,来自英特尔的两位专家——英特尔(中国)有限公司服务器平台产品经理张振宇,与英特尔数据中心事业部亚太和中国区高性能计算/工作站方案架构师何万青为我们带来了最新的英特尔未来产品的发展动态与战略理念。

来源:ZDNet 2010年11月24日

关键字:英特尔 HPC Westmere-EX Sandy Bridge

不久前全球知名的TOP 500超级计算榜单发布了最新的排名,在这个可以说发展无止境的领域,如何进一步提升系统的处理能力并降低单位性能的功耗,是各高性能计算(HPC)厂商共同追求的目标,对于最终的系统集成与提供商如此,对于最基础的计算单元——处理器的厂商更是如此,而作为占据了全球TOP500强系统近80%装备份额的英特尔处理器来讲,它的发展,它未来的进化方向无疑是备受瞩目的。近日,来自英特尔的两位专家——英特尔(中国)有限公司服务器平台产品经理张振宇,与英特尔数据中心事业部亚太和中国区高性能计算/工作站方案架构师何万青为我们带来了最新的英特尔未来产品的发展动态与战略理念。

英特尔眼中的TOP500与2011年产品布局

英特尔的至强处理器是当前服务器乃至HPC系统中最常见的处理单元,而在英特尔的HPC战略中,也紧密的围绕着如何应对未来HPC应用挑战来展开。

英特尔应对HPC应用挑战的三大能力与方向,分别是先进而强大的生产工艺与产能、技术领先性与优秀的产品规划与抵达市场的能力

英特尔(中国)有限公司服务器平台产品经理张振宇表示,从大方向来看,高性能计算有两方面,一是千万亿次已经成为一个标杆,下一个则是百亿亿次,它们带动了IT产业计算发展的趋势,也使IT摩尔定律的延续得以保证。另外一个趋势,我们可以看到越来越多的应用,从研究机构、高校逐渐走出来,更多落在各式各样的行业、应用于商业领域。这两个方面是现在客户提出来的两大趋势。从这两个趋势看,英特尔一是要引领高性能计算技术的发展,推动千万亿次向百亿亿次的发展。二是我们要努力的帮助我们行业客户利用高性能计算解决他们实际的问题。

从英特尔来讲,无论是从生产制造工艺到他的技术领先性,产品的路线图以及产品的交互能力都是帮助客户在不同阶段来完成客户不同的一些需求。而这其中,保证英特尔技术领先的,是Tick-Tocks模式的创新,张振宇强调,这个创新也会持续下去。在明年大家会看到英特尔进入一个Tock的阶段,即会推出一个新的架构Sandy Bridge,它对于高性能计算,尤其在浮点计算2倍的提升方面使大家非常关注和期待。

TOP500强中英特尔相关信息分析

对于最新的TOP500的名单,有几点是大家所关注的,一是值得每一个中国人骄傲的,来自中国的天河一号A第一次实现了在TOP500里面的第一名,它采用了14396颗英特尔至强5600处理器。而第二点则是,刚刚发布的至强7500系列也出现在榜单上,在TOP500里有三台这样的系统,最高的排名是法国的原子能委员会的系统,排名第六。在前五名里面有三名是采用英特尔至强处理器。而在今年最新上榜系统里,90%都是采用英特尔处理器,在整个TOP500榜单里面,398套采用英特尔处理器,接近80%的份额。其中我们可以看到,至强5600系列虽然是今年刚刚发布的,但是在榜单里面已经出现了58套,5600和7500在性能上的提升,也是值得高性能计算生态系统的关注。

张振宇表示,我们在高性能计算平台以往的情况下,大家没有过多采用7000系列的处理器,其实,早前英特尔在谈高性能计算计算的时候并不太建议客户采用至强7000系列的的处理器,因为其前端总线在内存的性能并不能保证应用的获得更好的性能。然而7500系列它的架构有了变化,在内存上,最终带来不仅仅是性能3倍的提升,同时带来高性能计算的一些拓展。因此,从今年开始,对于用户的选择来讲就面临一个问题,什么样的应用适合在两路的机器上跑,什么样的应用适合在7000系列的处理器上跑。尤其是针对性能架构比较敏感的客户,或者对CPU性价比要求比较高的客户,他会选择至强5600系列的处理器。而某些对于内存带宽和内存容量有特殊的要求的应用,比如像气象、生命科学对于内存的容量和带宽有很高的要求,则会选择至强7500处理器,其内存的容量在8路至强7500系统上达到2个TB。

说到至强7500,就不能提到它的孪生兄弟至强6500,它是一款双插槽的处理器,但具备了与至强7500一样的核心数量及内存扩展能力,不过在TOP500榜单上没有它的身影,对此张振宇解释到,6500的定位瞄准的是某些商业应用,它对处理能力要求并不是很高,但是对内存I/O有比较大的应用,但是在高性能计算里介于计算和内存容量之间。一般应用比较偏计算或偏内存容量。所以6500在高性能计算并没有太突出的表现,现在主要是面向商业应用。

至强7500的接班人——Westmere-EX

谈到2011年的产品规划,张振宇表示,明年英特尔会有两个重点产品发布,一个是7500系列后续的Westmere-EX,实际上是产品制程工艺的改进,从45纳米增加到32纳米,核数增加到10核,内存容量也带来了提升。值得高性能计算领域期待的是,我们明年的Sandy Bridge,Sandy Bridge有一个非常大的特点,引进了AVX指令集,能够使浮点性能得到双倍提升,会达到8核,这款产品将在2011年下半年发布。

英特尔处理器新纪元的开始——Sandy Bridge,可谓万众期待

不过,回顾英特尔这两年的产品发布规律,一般都是在每年的第一季度发布新一代的双路平台,而这次Sandy Bridge要延后到2011年下半年,那么在双路HPC市场的话,英特尔明年的市场布局是不是还是以5600为主,会不会有些竞争上的压力?对此,张振宇表示,明年5600还是主流,但是我们在明年会有一个产品的更新,针对高性能计算,我们会有中端的至强5645和5649,它们会增加核心,来提高满意度和产品的性能。原来在中端是四核,我们接下来这两款产品会变六核,性能会提升,整体的产品都会有一个更新。虽然的确是与以往的发布规律不同,但仍然坚持着每年一更新的基本步调。

英特尔未来HPC发展之路——MIC与x86共用编辑环境

在张振宇介绍完明年的产品布局之后,英特尔数据中心事业部亚太和中国区高性能计算/工作站方案架构师何万青为我们揭示了英特尔未来的HPC发展之路与核心理念。

英特尔的HPC战略也可以分为三个方向:第一就是传统的至强处理器平台,第二个则共用的编程工具与环境,第三则是未来的重点突破——集成众核的新一代大规模并行处理加速单元

何博士一上来就将重要放在集成众核的新品上,即Many Integrated Core(MIC,中文发音“麦克”)。何博士首先介绍到,在这次SC10发布会上英特尔有一个DEMO,做的是一个金融应用,这个应用是我们从开放资源社区获得的,其源代码跟至强上是一样的,主要是使用Knights Ferry,它是一个软件开发平台,这个平台是我们用来验证我们的工具编译系统,在上面跑的代码,能够为了它的实际产品,就是Knights Corner,实际的产品是22纳米发布的产品,来做技术的准备和反馈的。而MIC的重要特性也在这一DEMO中得以展现,它就是它可以运行现有的x86代码,而无需用户做出什么巨大的改变,这一点是英特尔发展MIC的基础理念。

Knights Ferry的基本规格

目前,英特尔在中国也选择了一些用户参加Knights Ferry客户方面的合作,何博士表示,我们有一个欧洲试验中心,欧洲中心做一个怎么样在原有的至强上面可以很容易把代码进行移植和使用。这里的亮点是,我们现有的开发工具都对MIC进行了扩展,大家可以使用完全一样的编程模式和语言,而且下一个正式的产品Knights Corner是在22纳米上实现。我们强调一下目前80%以上主流的高性能应用还是跑在计算机即CPU的架构里面,我们说至强架构是一个最好的选择。另外,无论技术如何发展,有一个高性能计算上逃避不过去的问题,就是安达尔定律,除非你发现更好的构建应用的方式,它一定会有一部分是不适宜做并行的。我们认为对于哪些应用更适合MIC呢,MIC的架构是为了高度并行的应用,或者是高度并行应用里的一部分。所以也要向大家再强调一下,过去大家可能听说过Larrabee,我们后来为什么要强调高并行计算应用,很多用户对吞吐量定义有模糊的地方,而更清晰的定义是,MIC的设计是针对高度并行的应用,而这种应用可能会跨不同的行业,不一定是高性能。重点是我们用同样的开发工具和开发模式去支持。

未来Knights家族真正的商品化成员就是Knights Corner(英特尔还没有官方的中文名称,所以只以英文为准),22nm工艺,50个IA核心,从生产工艺上我们就能推断出它的上市日期将在2011年年底

谈到共用的开发工具与环境,在刚刚过去的10月份,英特尔推出两套针对高性能计算的产品。一个产品叫Parallel Studio XE,这个版本既支持Windows,也支持Linux,它把英特尔的性能库、侦测工具放在一个里面去,目前这个产品支持Visual Studio 2011,也支持2003和2008。另外,针对集群的计算还推出了英特尔Cluster Studio把这上面的工具重新进行组合,特别是这两套产品中集成了新的编程模式,这里所有的工具都支持至强和MIC。同样的编程模式和编程环境,可以是用在CPU上,也可以扩展到MIC上。何博士强调,我们可以认为,这样的方式就像我们多年做的那样,我们每一代产品都向后兼容,向我们上一代兼容,最大程度保护使用者和开发者的投资。

英特尔新一代的HPC编程工具,为未来的MIC产品已经做好了准备

不过,谈到MIC的发展,必然会涉及到一个敏感的话题,那就是CPU+MIC与CPU+GPU哪个更好?事实上,在新的一期的TOP500榜单里,前10名的计算系统有三套采用了CPU+GPU的架构。中国一套,日本两套,美国有5套系统,其中有一套是用了Cell,那么英特尔如何看待这一问题呢?

何博士表示,在中国我们采用CPU+GPU架构是用户的一个创新的选择,也是导致中国现在有第一套在TOP500排第一的原因。从英特尔来看,我们采用集成众核,采用同样的编程模式,里面可能涉及更多的技术细节。一个是那些高度并行的应用最多只有20%,而且即便高度运行的应用更适用于GPU,但是还是会涉及到缓存的问题。英特尔在考虑非常长远的技术道路的时候,我们得出的结论是MIC,这是我们认可的方向。GPU是大家现实中的一种选择,只是采用CPU+GPU的模式,它在应用的类别上是非常少的,因为它要克服编程模式带来的困难。这是从技术上的评估,你们可以具体看一下,这样的系统,目前真实的的应用有多少在上面跑,需要克服的问题有哪些,所以对于最终用户来讲,出发点可能就不一样了,这可能也是比较成熟的HPC应用的国家现在还没有出现大量的GPU高端HPC系统的原因。

英特尔未来HPC发展之路——Intel Cluster Ready中国发力

当有了好的硬件产品和软件工具如何,如何让客户能更迅速应用到它们呢,这就是英特尔正在推动的Cluster Ready项目(简称ICR,Intel Cluster Ready)所要完成的任务,事实上这个项目并不是新的,但它即将在中国发力,为中国中小型HPC用户提供更便捷的服务。而这对于未来进一步推广英特尔的MIC与共用编程体系架构的战略也将至关重要。

Cluster Ready对于那些没有自己的HPC应用经验和相关资源积累的中小型用户有着巨大的吸力力

对于Cluster Ready,何博士介绍到,我们从2007年开始这一项目,目的是帮助OEM制造商与软件开发商能更好的为用户服务,比如怎么样使你的集群的部署、选型、维护更有效率,并让它快速跑起来。为此,英特尔提供的相应的工具和规范,让大家通过这个工具和规范快速的把Cluster建起来,并可以远程排错。这个计划进行的很多年之后,有一个网站,英特尔网站上有例子包括各个OEM厂商,各软件开发上,包括中间件开发商都在里面。它的好处在于,英特尔在搭建一个Cluster的时候有一个规范,相应的有软件商和设备商本身在这个环境下进行测试的产品名单,在选择的时候进行混合就可以了,甚至你不在这个里头,你可以使用英特尔的规范,还有相应的开源工具进行测试。

然而,这其中有一个问题在于参与ICR的OEM与ISV厂商名单,对于不同地域和国家,比如在中国,又会怎样的变化呢?何博士表示,中国的用户有中国用户优先考虑的问题,包括我们自己应用的水平,虽然我们今年是全世界第一名,但是我们应用的程度和水平可能还有一定的差距。这种情况下,全球在部署ICR是有计划分步做的,包括在巴西、阿根廷我们都先去做这些工作,在亚太区就像滚雪球一样,到现在你也知道一些消息,现在像戴尔等其它厂商已经有很多套系统在里面了,这也是随着中国高性能计算的投入和设备产生越来越多,我觉得ICR的价值会更大,尤其我们有更多的厂家已经有验证在里面的情况下。至于哪个厂商在ICR里是排名第一还是第几,在我看来并不重要。你可以在英特尔网站上看到所有厂家和系统,包括他们参考的设计。的确是有国内的OEM厂家有这个意向,我们也非常高兴,最近我们正在做这个计划,比如说应用和一些迫在眉睫的问题解决的情况下再推英特尔的Cluster Ready。我们最近全球很大程度上需要我们的厂家和软件开发上很大的配合和投入他们的人员和精力,去协同英特尔做这件事情,从技术上来说,英特尔已经做了很多,也是希望通过媒体去呼吁,看看这件事情如何做下去。

张振宇随后补充到,ICR这件事情是对用户有帮助的事情,但是对于OEM厂商来讲,因为OEM厂商的重点也是不同的,战略也不一样,这也是之所以前两年没有在中国努力推Cluster Ready的项目所在。现在来讲,你会看到越来越多的OEM厂商更加看中中小集群市场,中小集群市场本身的技术能力和覆盖能力,ICR在这个时候可以帮助我们去开拓市场,ICR从我们认为目前在中国推是比较成功的点。

通过标准的规范、统一的硬件测试与认证、软件确认与注册,选择相应的Cluster Ready应用与硬件集群的方式,最终一站式的交到用户手中,并迅速的投入生产

简而言之,Cluster Ready将能解决三个大问题,一是更好的性能和性能功耗;二是用户如何有效使用这套系统,英特尔有各种培训来帮助用户;三是怎么样更快的部署和降低你维护在这个系统上的消耗。对此,何博士举了一个真实的案例,有一家公司,我们的承包商在建筑设备中要进行一定的改建,但是他们要知道工程中的连接件是否有足够强度,实验做起来是没完没了的,他们需要有这么一个应用去算这个案例,算完之后就能告诉你什么样的设计是可行的,什么是不行的,再把可行的放在数据库里,以便下一个人再有这样的服务,直接就可以找到。他们对这些东西非常了解,但是往往如果没有一个好的交钥匙的功能,花很多时间买集群、配置集群,出了问题怎么样,所以他不是专家,我们希望把这个时间缩短。最后,我们通过ICR解决了这个问题。

不过,在现实的HPC选型中,往往也会出现从一开始就因为认识的局限性而走弯路的可能,比如一些用户会简单的认为5600适合于浮点运算,7500适合于高并行、大吞吐量的运算,但是对于用户来说并不知道他这个软件到底是要大吞吐量的还是高浮点的,很可能会出现怎么用至强5600的方案都不满意,最后换用至强7500服务器,倒有茅塞顿开的感觉,所以市场上需要一种准确的参考意见,省去用户前期的摸索阶段,这显然比ICR现有的只是帮助用户在搭建阶段提供便利性更为重要。

就这一话题,张振宇表示,我们现在做的主要工作是,要去整理一个应用库,什么应用针对什么架构是合适的,给我们的合作伙伴和用户一个建议。ICR也是我们今年要重点做的事情。我们一直在致力于推动用户根据他的应用选择合适的架构,而不是单纯的拿一个集群来跑Linpack。而且,从未来的趋势来看,我们的CPU会更加细分,比如会推出MIC,不同的CPU会在不同的应用上,我们未来做的工作是,能够让客户参考,我知道我自己的应用,根据这个应用去查我需要什么样的架构,尽量减少他来回试到底什么样的架构更适合我的工作。明年我们会有两个重点,一是我们会去推动用户对真实应用性能的理解,包括什么样的应用适合在什么样的架构上跑,然后我们再去根据应用,业内的一些倡导者,联合做一些客户的宣传。Cluster Ready我们争取在明年有更多的客户做一个更简化的选择。

何博士接下来补充到,我们从做大量案例中总结出来的一些模式,这些模式哪几大类商业应用适合什么样的平台,但是这个应用的适合是我们跑的工作负载和Benchmark得出来的,我们以往是根据客户的Benchmark做的测试得出这样的结论。我们现在要做一些工具,我们会给一个大致的范围,当这个植入到什么到什么之间你选择什么平台,这里面存在系统的变量、应用的变量、用户测试数据集的变量。通过这三个变量,我们现在积累了很多数据,我们想初步整理出这样一个工具出来,能够通过OEM、通过用户发表的一些参考去服务。由于存在这些变化,所以我们才有Cluster ready通过软件厂商的介入,有很多应用看来已经有很多的参考文档。

英特尔未来HPC发展之路——期待以太网成为最终的HPC互联统一之选

接下来,何博士谈了谈对未来HPC互联的一些个人看法。现在的数据中心网络基本上是三块,一块是来自互联网,另外一块是作为高性能计算的设备,比如Infiniband,现在还有50%在TOP500里面的系统还是在用以太网、千兆网,另外还有一大部分的数据越来越多,在数据中心中使用专用的SAN互联,即光纤通道(FC)或是基于以太网的iSCSI,这些大概能占25-30%。英特尔希望这种解决方案越简单越好,就使用同样的设备,受制于千兆网的带宽,随着至强5600、7500的推出,以及VT-d、VT-c等与I/O互联相关的技术的成熟,英特尔极大地改善了应用带宽的瓶颈,从而希望万兆网成为一种标准,将以上目前的三种网络应用都可以通过万兆的以太网来实现,所有的东西都是IP化的。

目前,英特尔现在有两款主要产品,一款可以用在主板上,即LOM(Lan on Mainbroad),其控制器是8259,可以达到千兆网10倍以上的带宽,但是它不如另一款iWARP(Internet Wide Area RDMA Protocol,互联网广域远程直接内存访问协议)产品的延迟表现好,后者的延迟已经达到了Infiniband的水准。

至此,何博士总结到,英特尔已经有很好的CPU,很好的内存带宽,相应的互联也应该达到这个要求。英特尔从万兆网卡,还有SSD硬盘,希望提供一个比较多的平台。现在有部分上榜的系统使用的是万兆网,但是它用的不是英特尔的,还有一些不在榜上。我后面提到,除了CPU、处理器以外,我们在Many Core上面,都在推动用户的需求。

最后,何博士强调,现在市场上有多种HPC解决方案,包括大家现在正在热议的CPU+GPU的混合架构,从英特尔的角度来讲,完全尊重这样的技术创新,它们对于用户肯定是有价值的。但是,对于英特尔来说,则有自己坚定的发展方针与路线,我们将遵循共用编程体系环境的基本理念,从MIC、至强处理器、强大的编程工具以及积累的Cluster Ready解决方案来走出一条自己的HPC之路,而把最终的选择权留给我们最终的服务对象——那就是用户!

综合评分:8.13 分
云能力:8.3 分
营业额:533亿美元[2012]
云服务:英特尔云计算

查看更多 >>

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅ZDNet技术邮件将是您的最佳途径之一。