科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道高性能计算应用为本 2011英特尔HPC研讨会综述

应用为本 2011英特尔HPC研讨会综述

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

英特尔日前在昆明举办了主题为“应用为本寓智于衡”的2011年高性能计算研讨会,邀请了来自国内高性能计算领域的专家、合作伙伴和行业客户,就共同提高并行计算在地质勘探的性能做了深入的探讨。

作者:孟庆 来源:ZDNet China【原创】 2011年7月1日

关键字: 英特尔 高性能计算

  • 评论
  • 分享微博
  • 分享邮件

ZDNet至顶网服务器频道 7月1日 昆明报道(文/孟庆):英特尔日前在昆明举办了主题为“应用为本寓智于衡”的2011年高性能计算研讨会,邀请了来自国内高性能计算领域的专家、合作伙伴和行业客户,就共同提高并行计算在地质勘探的性能做了深入的探讨。来自英特尔的高性能计算架构师David Scott(高大伟)博士详细介绍了高性能计算用户当下的实际需求,以及英特尔针对并行计算方面的优化经验。

应用为本 2011英特尔HPC研讨会综述

提升高性能计算效率需解决I/O瓶颈

David表示,如今的高性能计算用户普遍都要求拥有较高的应用性能和性价比。此外低功耗、高密度和易用性是用户需求的重点——因此如何提高计算效率和优化算法成了地质勘探领域高性能计算用户所关注的核心重点。对于这部分地质勘探领域的高性能计算来说,用户需要通过缓存分块最小化存储带宽占用,而在内存中实现数据序列以充分利用SIMD指令行,应用能感知NUMA的内存分配和MPI负载均衡技术可以最大化的提高内存使用率。

而内存的使用问题也牵扯到了硬件方面的I/O问题和软件层面的算法调度问题。据介绍,相比1940年的计算速度和存取速度,如今的计算速度已经百倍于系统I/O速度,因此目前阻隔高性能计算速度的关键在于系统I/O,而通过优化应用的算法则可以尽可能的减少I/O瓶颈,并且将应用负载尽可能的并行分布到各个计算核心中。

David举例表示,在地震成像算法中需要从5维数据中通过科西霍夫偏移、单波程波动方程偏移(WEM)、逆时偏移(RTM)和全波形反演(FWI)等步骤得出3维底层模型。而这一算法需要多进程、多节点的集群做大量计算。他表示,这类油藏模拟计算一直以来都是对内存访问和浮点计算需求强烈的计算任务之一,并且要求数据访问的带宽尽可能的大。

应用为本 2011英特尔HPC研讨会综述

对于这类需求,David表示英特尔一直在努力提高处理器单核心的计算能力,并且努力提升多核处理器内核间I/O以及对内存的访问带宽。因此从处理器发展历程上来看,英特尔至强处理器一直在提升自己的核心数量和线程数量,并且将在不久的将来推出MIC众核架构产品,该产品将采用22nm工艺集成超过50个x86内核,并具有多种形态——包括类似显卡的PCI-E加速卡。

而另一方面,David也表示目前很多石油和勘探企业使用的超级计算机采用的英特尔至强5600处理器非常适于侧重于浮点计算的高性能计算应用。这款于2010年春季问世的处理器凭借业界领先的32纳米制程工艺和全新酷睿微体系架构实现了比上一代产品高达60%的性能提升。据英特尔介绍,在配备至强5600处理器的平台上,有75%-80%的高性能计算应用均可以最佳状态运行。至强5600集成的英特尔睿频加速技术(IntelTurbo Boost Technology)、英特尔智能节能技术(Intel Intelligent Power Technology)等智能计算特性,还让高性能计算系统能即时感知应用负载的变化,从而以更高能效,更灵活地满足不同应用的需求,为高性能计算提供一个平衡高效的平台奠定了基础。

应用为本 2011英特尔HPC研讨会综述

据David透露,英特尔将于2011年下半年推出至强E5处理器平台,它将成为至强5600处理器的继任者,担起双路服务器市场主力平台的职责。在这方面,它带来的提升主要表现在性能和能效上,而这将主要源于它所采用的全新Sandy-Bridge微架构。虽然目前还没有更多数据表明它可以带来多大幅度的进步,但从英特尔台式机及笔记本电脑处理器更换Sandy-Bridge微架构后的表现来看,继续赢得企业用户的青睐对它来说应该不是挑战。

此外,由于它新添了AVX(高级矢量扩展)指令集,以及相对应的较高宽度矢量处理单元——加速浮点计算密集型应用,该技术使用最小的核心面积实现了双倍的浮点吞吐量。David预计至强E5凭借以上优势将在注重浮点计算性能和并行处理能力的高性能计算领域发挥出更强的威力。

不过,David也表示,英特尔认为未来的高性能计算系统随着计算性能的攀升,会带来不可避免的高能耗。而要避免CPU堆叠带来的过高耗能,只有采用协处理加速的方式。目前的GPGPU解决方案存在的弊病在于编程困难,对于高性能计算来说需要重新编写很多代码。而英特尔早在去年ISC上宣布的MIC众核计算架构则完全采用了x86内核设计,未来将与至强平台一同服务于高性能计算系统。

软件层面来看,英特尔在高性能计算方面拥有很强的优势——由于自身x86技术的成熟,英特尔的编译器可以帮助用户最大限度的优化其应用在至强平台上的计算性能。此外,英特尔Parallel Studio并行计算编程软件也能极大的改善用户编写多核应用的难度。

应用为本 2011英特尔HPC研讨会综述

另一方面,由于绝大多数高性能计算用户都希望自身超算系统运行的越快越好,因此英特尔的NodeManaer节点管理技术可以监控整个高性能计算中心的功耗和运行状态,并且在部分低负载(例如待机阶段)的时候帮助降低该系统的功耗。对于地质勘探用户来说,其高性能计算的数据有批量性特征,因此NodeManager可以提供一种计算策略,当有批量计算数据需要计算的时候,NodeManager可以自动将整个系统至于满负载的供电状态,而当任务量小的时候,则可以自动限制整体系统的功耗。

东方地球物理研究所重发展更重实践

来自东方地球物理研究所的总工程师赖能和先生已经连续多年参加高性能计算研讨会,他表示目前地球物理的勘探和需求不断增长,而相应的高性能计算技术也日新月异,每次来都能学到新东西。

应用为本 2011英特尔HPC研讨会综述

据他介绍,目前东方地球物理研究所拥有超过58000颗CPU内核,提供了580万亿次计算能力。而仅2011年该所就新采购了2400多个新处理器,其中95%采用的是英特尔至强处理器。

他表示研究所在对地球物理勘探的高性能计算做研究时需要做大量的设备、算法测试方能发现真正的瓶颈,找到更好的解决方案。据他介绍,目前地质勘探领域高性能计算中影响CPU利用率的因素很多,其中存储性能对CPU效率影响最大,包括存储架构、软件、调度管理都大大延迟了CPU的计算响应和效率。因此在一系列测试之后,赖总表示采用英特尔SSD做高速Cache是一个解决方案,而阵列则是大规模存储数据的选择。

赖总对记者出示数据表示,他们发现带并行软件的盘阵性能大于SAN,而SAN的性能大于NAS;而RAID模式则是RAID 6比RAID5读写速度要快,并且RAID6允许同时坏2块盘,比RAID 5更加安全。

应用为本 2011英特尔HPC研讨会综述

此外,赖总认为目前的多路多核服务器(胖节点)已经日趋成熟,包括HP PL980 G7、IBM x3850 X5、曙光天阔I950r-G、富士通RX900在内的四路、八路服务器已经可以作为小型地质处理站点/运算平台提供相应的地质解释。而以上多路产品均是基于英特尔至强处理器平台。 

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章