扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
高性能运算(HPC)将性能发挥到极限,它提出的要求不是一个高端工作站能够实现的。但是高性能运算适用于您的公司吗?我们最近与英特尔的两位高性能运算专家进行了交谈,他们是 Tom Lehmann 和 Richard Libby。本文探讨了高性能运算趋势背后的情况,并重点向您介绍了在考虑转变到高性能运算时需要注意哪些事项。加入我们,亲临现场聆听专家的独到见解,了解顺利转变到高性能运算的必要规划。
高性能运算实用定义
问:让我们先来了解一下高性能运算的实用定义?
RICHARD LIBBY:高性能运算(HPC)是多台联网的独立计算机的组合或集群,它们通过协调工作来解决问题。通常,这些机器紧密耦合在一个站点,通过 Infiniband* 或某些其它高端互连技术相互连接在一起。
TOM LEHMANN:高性能运算的主要目的在于计算数字,而不是进行数据排序。它要求通过专门的程序优化来最大限度发挥系统的输入/输出、计算和数据移动性能。这些机器由于需要不断地来回传送信息,因此必须相互信任。
问:我们公司只想购买一台更大的服务器,那算不算高性能运算?有何差异?
TOM:高性能运算系统基于并行计算,通过并行处理来降低程序运行时间。如果程序可以并行处理,那么您的可用节点就越多,所以就越好。这就像漆墙一样,如果您有朋友可以一起漆,那么工作进展就会快些。但是有些应用必须进行串行处理,如造房子。某些应用只能运行于一个 CPU 之上,没有捷径,也无法分拆。在这种情况下,您只能是购买更大、更快的机器。
但是并行性也是有限制的。Amdahl 定律对此有详细说明,并规定了应用能够有效使用的节点数量。对于您最多可以使用多少枚处理器来解决一个问题是有限制的,超过这个限制系统将会崩溃。好比您构建了一个十倍大的集群,这并不意味着能够以十倍的速度解决问题。然而,更大的集群就表示更多的人可以同时处理部分问题,从而同一时期内可以完成更多工作。
高性能运算适用于您的行业吗?
RICHARD:高性能运算的应用非常广泛。几乎每个行业都有高性能运算集群,从教育到娱乐到高科技领域。
TOM:在航空航天工业,完成一项飞机设计并发运前,要进行大量的计算。在石油行业,当找到了一片或许有开采价值区域,地质信息需要进行更多的处理。因此您要将现场信息带回去,输入集群计算机,通过一些功能强大的软件进行处理,最后算出这个地方是否有石油。谁最先计算出这个地方是否有石油,并最先中标,才能获得胜利。其他人也就失去了机会。
RICHARD:再来看看电影制片公司制作的动画长片,这些儿童电影。动画电影的渲染是一项需要大量并行处理的活动。对于一部片长 90 分钟的电影,他们需要渲染 90(分钟)x60(每分钟秒数)x24(每秒帧数)=129,600帧。每帧要用约 45 小时的计算机时间来完成渲染。串行执行此项工作要花费约 655 年,但使用包括 1024 个节点的集群,只需要花费约 6 个月即可完成。
问:是什么促使企业转变到高性能运算?
TOM:率先将产品推向市场的企业就是赢家,无论是航空航天、汽车工业还是制药业。
速度与高性能
问:速度越快意味着性能越高吗?
TOM:速度通常很重要,但并不一定是最重要的因素。在高性能运算集群中,所有机器都致力于特定的数字问题,需要进行大量计算来得出结果。例如,国家车辆管理局驾照数据库查找速度尽管非常快,但不是高性能运算,更大程度上是查表,而不是计算。但是如果您在建造飞机,要计算 747 机翼上方的气流,那么速度越快越好。您要将机翼剖面分成若干个一英寸大小的部分,计算每平方英寸上方的气流等,然后不断重复这一过程。集群速度越快,您就能越早得出结果。
问:自高性能运算应用于雷达之后,又发生了哪些变化?
RICHARD:在过去的 20 年里,随着高性能运算的广泛应用,我们看到了两个方面的变化:首先,我们拥有了高性能处理器。第二,出现了基于商品的互联解决方案,如 InfiniBand、Quadrix等。
TOM:变化非常显著,速度越来越快,成本大幅降低;过去一台 286 电脑要两三千美元;如今,您可以到超市花几百美元购买到主板和电源。然而,现在您可以获得过去一百倍的性能和极大改进的通信速度。
RICHARD:如果汽车的价格像处理器一样,大约五美元一辆,那么人人都可以驾驶劳斯莱斯了。
问:企业在考虑高性能运算是否适合自己时,要了解哪些基本问题?
TOM:在构建高性能运算集群时,要遵循三个原则。原则一,应用决定如何构建集群:具体的表现如何取决于所运行的应用。这是因为处理器速度较快不表示运行此应用的速度就快。
原则二,计算与通信间的平衡。一个集群的各个构件不可能独立进行计算,它们要在某个点进行相互通信。然后重复这一过程;这与您设计硬件的方式又有区别。在资金有限的情况下,您需要分步来构建集群,包括用于通信的硬件、用于计算的硬件、或者节点、基础设施等。
RICHARD:构建集群的第三个原则是“将来还需要升级”!集群并非总是静态的,随着企业计算需求的变化,所使用机器的增多,集群会不断扩展。
了解详细信息
问:对于考虑转变到高性能运算的企业,需要考虑到哪些实际的细节问题?
RICHARD:计划,计划,再计划。有一大堆的细节问题,而这些往往非常重要。以布线为例。您可能非常清楚仅为一台设备布线的情况,并对此不以为然。那么您如何需要为一千台、甚至一万台机器进行布线,情况又会怎样?
TOM:不要忘记,进入系统的所有能量都将会转变成热量散发出来。如果一台机器散热约 300 瓦,那么 1000 台机器就会散发出 300 千瓦的热量。您如何进行冷却呢?您一定不希望以每小时六十英里的气流来进行冷却。
RICHARD:在伊利诺斯州国家超级计算中心,有一幢三层的大楼专门用于放置系统。其中有一层半的房间专门用于放置空调!在盖楼时,他们预测到了更坏的情况:计算房间堆满了大量非常热的机器。这种情况很平常。
TOM:甚至大楼中的位置都会非常重要。例如圣圣迪雅哥的超级计算机房,有段时间楼上其它房间发大水,而且水流入了机器,导致该机房瘫痪。因此各类实际问题都要考虑到。
RICHARD:另一个要考虑的细节问题是:您的过道需要多宽?如果需要进行维护,您如何接触到机器?我们看到过一些情况,在安装设备时,新设备根本无法进入过道。
英特尔与高性能运算
问:英特尔技术在当前高性能运算蓝图中起到怎样的作用?
RICHARD:还记得集群的第三个原则吗?目前,英特尔安腾处理器的性价比通常是非常出色的。Montecito 推出后,将会使这一性价比提升一倍。英特尔64位扩展技术(Intel EM64T)作为一种正在快速发展的用于 32 位设备的技术,提供了一种更加经济的选择。高性能运算的经济型解决方案是基于台式机主板的英特尔奔腾 4 处理器。
TOM:对于大多数应用,最终都要考虑性价比。基于英特尔处理器的系统与英特尔解决方案服务与培训提供的英特尔® 软件工具一起使用,通常可在整个集群使用期内带来最佳的性价比。