6月19日至23日,每年一度的高性能计算领域的国际盛会——第31届国际超级计算大会(ISC2016)在德国法兰克福举行。当地时间6月21日上午,国内领先的高性能计算厂商曙光公司全球首次发布了基于Multi-Host技术的“M-Pro”架构服务器——Multi-Hosted Multi-Processor,成为ISC2016新产品板块的耀眼新星。
巧妙的M-Pro架构设计
众所周知,在摩尔定律的指引下,CPU的多核化、SIMD向量化不断提升着计算机的理论计算性能。然而,简单地增加核心数、增加向量位宽也导致着高性能计算应用的并行效率越来越低、向量指令利用率等优化越来越困难,这成为了制约应用性能提升的最大瓶颈。
曙光此次提出的全新M-Pro架构就是要“反其道而行”,即采用单核性能更加高的Xeon E3-1200 v5系列处理器和Muti-host共享网络技术,配合曙光已有的高密度刀片技术,来设计实际应用性能更高,性价比更好,兼容性更强的服务器。
M-Pro架构的优势
1, E3 v5•强劲的单核性能
“提高CPU的单核计算性能是提升服务器应用性能最直接的手段,这一手段远比增加CPU核数更为有效。”曙光高性能计算产品事业部总工程师,戴荣博士解释说,“大部分高性能计算应用更喜欢主频高、单核性能好的服务器。一般而言,单核性能好,对实际应用就更有利,尤其是对计算、访问存储、通信密集要求高,而并行扩展性一般的应用而言更是如此。”
据了解,M-Pro节点采用Intel最新Skylake架构的Xeon E3-1200 v5系列处理器,该处理器3.0-3.7GHz的主频和更高的单核计算峰值(1.x倍)、更高的单核内存性能(1.x倍)、更高的单核网络带宽(2.x 倍)可提供比普通双路计算节点更为强劲的单核性能,能够更轻松地应对计算密集、访存密集、通信密集型应用。
2, Multi-Host•更先进的高速网络技术
针对普通双路节点上相邻两颗CPU上的进程跨节点通信性能不足且不均匀的问题,曙光选择利用先进的 Multi-Host高速网络技术作为解决方案。基于100Gb/s EDR InfiniBand的Multi-Host技术可以让多个节点共享一个网络设备,该技术已经被Facebook主导OCP组织认定为服务器网络标准。
“1片 CX20-G30 刀片包含2个E3 v5单路节点,2片CX20-G30(4颗CPU)共享一个100Gb/s EDR InfiniBand接口。这样一来,可实现0.6μs超低延迟、单核网络带宽达到6.25Gb/s,是普通双路节点的两倍多。”戴博士解释说,“Multi-Host高速网络技术可使所有CPU上的进程跨节点通信性能均衡,并且节点共享还可降低网络成本。尤其是低至0.6μs的网络延迟正是实际的应用程序所迫切需要的。”
“数据中心相关技术正在进入一个崭新的阶段,其中的网络互连部分正起着越来越重要的作用。Mellanox的Multi-host产品能够帮助曙光 等合作伙伴完成独一无二的可调节且性能优异的服务器解决方案。我们很高兴看到,我们的Multi-host 100G EDR InfiniBand产品能够被曙光M-Pro刀片系列服务器采用。我们坚信这个创新的解决方案将迅速获得市场关注。”迈络思(Mellanox)公司市场副总裁Gilad Shainer先生评价道。
3,一脉相承,上下兼容
近些年服务器市场格局变幻莫测,用户需求也不断提升。刀片服务器比机架服务器占用更少的空间,性能更高。刀片服务器的电路板上设置了关键服务器组件,每个服务器板消除了专用电缆和其他元素,能够为用户节约成本。
曙光的刀片服务器研发可以追溯到2004年,至今已经研制出6代刀片。此次推出的基于M-Pro架构的高密度刀片,不仅能够实现与曙光相关刀片的兼容,还可以实现与普通其他刀片的混插。极大的满足了不同客户多样性的需求。
曙光M-Pro架构发展路线
由于M-Pro服务器具有相同理论峰值下实测应用性能更高、相同投资情况下实测应用性能更好的显著优 势,它已经得到了高性能计算应用和互联网应用用户的着重关注。为了尽快服务客户,针对于高性能计算应用的M-Pro HPC服务器预计将于2016年7月量产。而针对于互联网应用的M-Pro Web服务器预计将于2016年10月量产。据悉,M-Pro Web服务器与M-Pro HPC服务器的主要差别会在网络方面。
M-Pro HPC:看得见的实测应用性能提升和更优的性价比
据测试,M-Pro架构服务器相比普通双路计算节点实测应用性能显著提高。如VASP, OpenMX, Espresso, CPMD, Lammps, WRF的测试数据都展现了近150%的性能提升。从成本角度来说,则相当于为客户节约了~30%的服务器购置投入。
曙光M-Pro架构服务器是一款从客户实际应用出发,采用最先进的处理器和网络技术,进行优化设计出的一款具有相当性价比竞争力的产品。这曙光一直以来秉承的“从客户应用中来,回到用户应用中去”的理念的又一次成功尝试。我们热诚的邀请用户一起来为下一代刀片技术献计献策,一起寻找和实现更加高效的计算解决方案。
更多曙光相关资讯,欢迎搜索微信公众号“中科曙光/sugoncn”,关注曙光公司官方微信,或拨打400-810-0466。
好文章,需要你的鼓励
自2022年底生成式AI革命爆发以来,服务器支出也存在类似的态势。一旦企业发现自己必须投资购置或者租用搭载GPU加速器的设备,往往会选择扩展现有服务器机群,被用于投资新设备的支出则自然随之下降。英特尔正在加大对其“Sapphire Rapids”至强SP的投入,AMD在其“Genoa”Epyc 9004处理器上也采取了同样的做法。
生成式人工智能在企业中的一个突出用例就是客户服务和支持。大多数读者可能都曾作为客户经历过与传统自动客服系统打交道的沮丧。但这种情况正在发生变化,这要归功于时下强大的大型语言模型和自然语言聊天机器人。虽然有报告显示,我们在处理复杂或敏感的咨询时仍然更愿意与人类交谈,但在提供简单的帮助时,机器人的能力已经越来越强了。
从电子商务到非营利组织,利用企业数据资产可能是组织成败的关键。机器学习和生成式AI是其中的一个组成部分,但要成功地应用这些技术则评估AI对业务的实际影响。
在对生成式AI进行了近两年的试验之后,许多IT领导者已经准备好扩大规模了。然而,在此之前,他们需要重新考虑数据管理问题。