科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道高性能计算曙光PHPC生物计算解决方案

曙光PHPC生物计算解决方案

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

PHPC100是曙光公司研制的最新高性能计算机产品,符合现在高性能计算技术和市场发展的趋势,可以解决诸多限制性因素,为生物计算用户提供适合的计算平台。

来源:ZDNet 2010年11月16日

关键字: 曙光 高性能计算 PHPC100

  • 评论
  • 分享微博
  • 分享邮件

  PHPC100是曙光公司研制的最新高性能计算机产品,符合现在高性能计算技术和市场发展的趋势,可以解决诸多限制性因素,为生物计算用户提供适合的计算平台。

  在详细分析的基础上,本文给出了基于曙光PHPC100的生物计算解决方案;通过生物计算领域两个典型软件:MPIBLAST和GROMACS在曙光PHPC100平台上的性能测试结果,佐证了无论是主要考验定点运算性能的MPIBLAST应用软件,还是主要考验浮点运算性能的GROMACS应用软件,在曙光PHPC100系统上都有着优异的性能表现。

  关键词: 个人高性能计算机,PHPC,生物计算,MPIBlast ,GROMACS


  编写人员:袁伟/技术支持中心 解决方案中心 高性能计算首席工程师
          马少杰技术支持中心 解决方案中心 售前工程师、博士

  1.生物计算用户需求

  限于多方面的原因,很多生物计算的用户还在使用工作站,乃至PC机作为计算平台,不能满足科研的需要。

  事实上,几乎所有的生物计算用户对计算平台都有更高的需求,科研工作需要匹配较高性能的并行计算平台。但用户要购置并行计算机会遇到一些问题,这些问题很有代表性,体现了许多高性能计算用户的共同困惑,解决这些问题,提供适合的高性能计算系统解决方案是用户的切实需求。
用户的困难体现在:

    经费有限

  只有几十万,甚至十几万的预算,采购高性能并行计算机力不从心,如果采购低端的计算机,则性能、稳定性、易用性等没有保证。

    没有机房

  没有专用机房,采购了并行计算机无处放置;有的单位虽有中心机房,但计算机放置在机房里给使用管理带来诸多不便,受到很多限制,不能满足用户的要求。

    供电问题

  没有条件为高性能计算机专门配电,只能使用普通墙电。
噪音污染

  办公室环境不容许计算机有很大的噪音,普通的机架式集群或刀片服务器都不可放置在办公室环境。有些用户在办公室划出一定区域使用玻璃墙隔离出来,以放置并行计算机系统,但其噪音仍然比较大,影响用户正常工作和身体健康。

    性能效率低

  并行计算机系统已经进入高效能时代,对用户而言,重要的是应用性能和产出率,理论性能相对而言并不重要。生物计算平台需要达到一定的性能,以取代工作站和PC机,满足科研对计算处理能力的需要,同时要保证高效率。

    安装部署困难

  高性能计算平台是相对比较复杂的系统,包括多种硬件,系统软件,并行中间件,应用软件等多个层次。系统的安装部署,以及必要时的恢复也比较繁琐,对于非专业人士更是如此。困难还体现在应用软件的部署和优化。

    管理不便

  很多用户对并行计算机的使用管理感到是一种负担,有时需要专门的系统管理员来管理并行计算机系统。管理不便给系统的正常使用造成隐患,并且会增加成本。

    功耗较大

  高性能计算平台是相对较大的系统,功耗相对较大,因此,功耗是用户最为关注的问题之一,往往会影响到用户的抉择。节能环保不仅可以为用户节省电费,也符合现代社会的发展理念。

    TCO过高

  在几年前,拥有并行计算机系统是相对奢侈的科研条件。现在虽然硬件价格下降较快,但计算系统的TCO仍然不低。TCO是综合成本,很多时候,采用某个方案或某种产品,可以降低某个点的费用,但却增加了其他点的费用,TCO并没有降低,甚至更高了。

  解决以上问题,才可以使更多的用户使用到高性能计算机,促进高性能计算的普及。所以市场需要一种新的高性能计算机产品和方案,为用户提供理想的计算平台。

2. 曙光PHPC100

  曙光PHPC100是曙光公司在2008年5月推出的新型高性能计算机产品,PHPC100是个人高性能计算机,也可以称为桌面高性能计算机。


曙光PHPC100具有以下特点:

  是一种模块化、集群(Cluster)架构的高性能计算机

  具有PC机、工作站、低端小型机所无法比拟的性能

  无需专业的机房、供电设施、散热设施,可以和PC机、工作站一样,放置在办公桌的桌面附近,适合办公室环境

  配置专用的软件包,可以实现软件的自动安装部署

  具有良好的易用性,对使用者的门槛要求很低

  管理简单方便,无需专门的系统管理人员

  曙光PHPC100采用全模块化设计,背板连接,包括5个计算模块,最大支持10颗双核/四核处理器,采用20Gb Infiniband高性能网络和千兆以太网进行互联。

  多台PHPC100可以互连,实现系统规模的可扩展,并有效保证用户投资。系统规模扩展后,每个计算模块仍然可以保持高速Infiniband网络连接,保证系统性能的可扩展性。

  PHPC100支持WCCS2003、WHS2008、SuSE Linux、RedhatLinux、CentOS等操作系统,配备系统管理软件和应用软件包。

    曙光PHPC100有如下优势:

  PHPC100是专业为HPC应用而设计的计算平台。

  PHPC100在硬件上采用模块化的设计方式,非常便于安装、管理和维护。同时在软件上,采用定制化的高性能计算系统软件环境,专业的高性能设计方便用户的使用和维护。

  采用低噪音、低辐射等办公环境设计,便于用户的使用。同时,通过管理软件和应用软件包,降低了用户的使用和管理难度。

  采用X86集群架构,易于保证和核心高性能计算环境的同构和兼容。PHPC100可以配置40个处理器核心,并可以通过多台PHPC100互连的方式实现扩展。

3. PHPC100在生物计算中的应用

  3.1适用性分析

  受限于应用软件的性能可扩展性,并行计算平台并不是规模越大性能越好。根据统计,大多数生物计算应用软件的性能可扩展性在8-60,更多的进程并不能带来性能的提升。

  单台PHPC100可以配置5个计算模块,达到40个处理器核心,可以满足大多数生物计算应用的需要。在有扩展需求的情况下,可将多台PHPC100互连,解决系统的可扩展性。6台PHPC100互连,可以实现240个处理器核心的并行处理,几乎可以满足所有的应用需要。

  所以与其他计算平台相比,曙光PHPC100可以生物计算用户提供非常具有特色和优势的解决方案,适用在办公室环境,从而避开了需要专用机房等苛刻要求。

    3.2生物计算软件包

  为了提高系统的易用性,优化应用软件的性能,曙光PHPC100平台配备了高性能计算应用软件包。

  软件包中包含了生物计算领域经常使用的多个应用软件,包括MPIBlast,Gromacs,NAMD,DOCK,Palm等。只需要菜单式操作,就可以实现这些软件在PHPC100上的自动安装部署,用户可以直接运行应用程序。

    3.4推荐配置

  曙光PHPC100计算机基于模块化设计,作为生物计算平台时,推荐配置如下:

模块

描述

数量

备注

机箱

内含无源中板,单向带宽425Gb/S

1

计算模块

2个AMD 双核/4核处理器;8个DIMM槽;两个2.5”热插拔SAS/SATA 磁盘槽位,可选Raid 功能,支持Raid0,1;双千兆以太网控制器;板载BMC 管理子卡

5

IB模块

实现计算模块内部高速互联,同时提供10 个传输速率为20Gb/s 外联端口,支持铜缆和光纤接头的转换;

1

千兆以太网交换模块

实现计算模块内部互连,同时对外4 个千兆RJ45 接口

1

最多配置2 个,实现
      8 个千兆RJ45 接口;

IO扩展模块

为每个计算模块配置1个标准PCI-E插槽

1

管理模块

可实现共享USB 功能、KVM 切换、计算模块状态、故障定位、开关机等全方位管理控制监视功能;可选KVM Over IP 功能模块

1

可配置2个实现1+1冗余;

电源模块

3+1冗余,每个电源模块500W

4

最多可支持6个,实现3+3冗余

管理软件

Dawning PHPC Full View Management System 管理软件;

1

操作系统

WCCS或Linux

1

生物计算应用软件包

包括MPIBlast,Gromacs等生物计算应用软件

1


  3.4方案优势

  1). 工作站的价格

  PHPC100计算机价格相对较低,标准配置在二十万人民币左右,随配置的变化价格差异也比较大。较低的价格为普通用户使用并行计算机敞开了大门,可以进一步促进高性能计算的普及,从事生物研究的每个组织和个人都可以买得起PHPC100,用得起高性能计算机。

    2). 高性能计算机的性能

  PHPC具有高性能计算机的性能。PHPC首先是HPC,属于高性能计算机的范畴。事实上,PHPC100可以提供40个处理器核心,通过Infiniband网络互连,可以发挥出优异的并行处理性能,满足大部分生物计算应用的需要。多台PHPC100可以互连,实现系统的规模扩展,同时保持系统性能的可扩展。

    3). PC机的使用环境

  PHPC100属于个人高性能计算机,也可以称为桌面高性能计算机,可以同PC机一样在办公室环境使用,对机房、供电、制冷没有特殊的要求。PHPC100计算机噪音小,辐射低,从而保证了办公室环境使用的可行性。

    4). 生物计算应用软件包

  PHPC100配置了生物计算应用软件包,软件包中包括多种生物计算应用软件。软件包可以实现应用软件的自动安装部署,并做了针对性优化。在PHPC100平台上,用户可以直接运行应用软件,避免了软件安装部署以及配置优化的繁琐过程。
5). 易管理使用

  PHPC100计算机配置了管理软件,简化了系统的管理维护,管理使用PHPC100计算机就像管理使用PC机一样方便

  6). 整体拥有成本低

  使用PHPC100计算平台,用户不仅仅是降低了计算机的采购成本,而且节省了机房等基础设施费用,节省了工业专用空调等制冷设备。并且,PHPC100采用了环保节能设计,与其他计算机系统相比,能耗更低。PHPC100计算平台不需要专职系统管理人员,可以节省人力成本。

4.性能分析

  4.1分析方法

    从计算特性上分析,生物计算的类型主要包括两类:

    (一)高通量计算(定点计算)

  基因序列比对、药物筛选等
    计算任务相对独立,进程间无通信或通信量很小,要求充分利用系统的计算资源,使总吞吐量最高
    需要较大的内存,较高的数据I/O吞吐量;较强的并发处理能力

    (二)高性能计算 (浮点计算)

  蛋白质三维结构预测、蛋白质-蛋白质相互作用、基因进化分析、分子动力学计算
    利用大量资源共同解决一个任务,使求解时间最短
    进程间通信密集,网络性能要求高

  为了掌握PHPC100计算平台针对生物计算应用的性能表现,对两个典型应用软件做了性能测试,并和其他计算平台的性能测试结果做了对比。

  MPIBlast是高通量计算的典型代表,Gromacs是高性能计算的典型代表。

    4.2MPIBLAST性能分析

  (一)软件介绍

  BLAST是现在应用最广泛的序列比对软件,用于基因序列的两两比对,由NCBI研制。MPIBLAST是NCBI BLAST的并行化实现,基于标准MPI并行环境,可以免费下载使用。
MPIBLAST软件的计算特点:

  定点运算为主;
    内存需求量大;
    MPI通信比较少,主要是网络文件系统的读写对网络性能有一定要求;
    I/O量比较大;

    (二)测试平台

  测试在3个平台上进行:

  曙光PHPC100,5个计算模块,使用Barcelona 2350处理器,主频2.0GHz

  曙光A950r-F胖计算节点,8个AMD Opteron8212双核处理器,主频2.0GHz

  IBM P575小型机,8个Power5双核处理器,主频1.9GHz

  (三)测试结果

  使用MPIBLAST 1.4.0版本;数据库使用month.aa,库所占空间为106MB;查找序列的输入文件为F.joh_aa.fasta,查找1500个序列;

  测试结果如下:


(三)结果分析

  在曙光PHPC100上,MPIBLAST有着优异的性能表现; 单进程的搜索速度较快;多进程并行搜索时,达到了近乎线性的加速比;

  2个节点的PHPC100的性能就高于1台A950r-F;

  一台曙光PHPC100(39进程)高于IBM P575(8路双核),而价格则大概为其1/5;

    4.3GROMACS性能分析

    (一)软件介绍

  GROMACS是用于研究生物分子体系的分子动力学程序包。它可以用分子动力学、随机动力学或者路径积分方法模拟溶液或晶体中的任意分子,进行分子能量的最小化,分析构象等。GROMACS最初是设计为生物大分子如蛋白质、核酸、脂类等物质的计算、分析服务的。由于其在非成键作用力的互相作用方面具有极强的计算能力,很多研究机构也用其来计算、研究非生物的大分子系统,如聚合体等。

  GROMACS是开源软件,最初由荷兰的Groningen大学的Department of Biophysical Chemistry开发。可以免费使用,有基于MPI的并行版本。
并行GROMACS软件的计算特点:

  计算密集型的程序,浮点运算量很大;

  GROMACS程序对内存的要求很小;

  MPI通信频繁,对互联网络性能要求高;

  I/O量一般,在REMD模式下稍大

    (二)测试平台
    测试在3个平台上进行:
    曙光PHPC100,5个计算模块,使用Barcelona 2350处理器,主频2.0GHz
    SUN4600胖计算节点,8个AMD Opteron8214双核处理器,主频2.2GHz
    IBM P575小型机,8个Power5双核处理器,主频1.9GHz

    (三)测试结果

  GROMACS使用源代码编译,版本为GROMACS-3.3.1;fftw为使用源代码编译,版本为fftw-3.0.1;测试中采用默认优化参数。使用gcc编译器,测试算例为gmxbench中的d.dppc,原子数目为121856,模式10ps;

  数据为程序运行最后输出的real time,单位为s;


  结果分析
     曙光PSC平台发挥了出色的浮点计算性能;
    1套曙光PSC的性能为1台SUN 4600(8路双核)的3倍;
    1套曙光PSC的性能优于1台IBM P575;

    案例分析

  曙光服务器用户体验中心成为PHPC100计算机在生物领域的第一个用户。

  曙光服务器体验中心是综合性的用户体验平台,许多生物计算的用户在体验中心做应用软件的性能测试。PHPC100部署到体验中心后,作为生物计算平台达到了很好的效果。系统部署简单,放置在值班区的办公环境使用,经过多项测试的验证,PHPC100计算机性能出色。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章