6月19日至23日,每年一度的高性能计算领域的国际盛会——第31届国际超级计算大会(ISC2016)在德国法兰克福举行。当地时间6月21日上午,国内领先的高性能计算厂商曙光公司全球首次发布了基于Multi-Host技术的“M-Pro”架构服务器——Multi-Hosted Multi-Processor,成为ISC2016新产品板块的耀眼新星。
巧妙的M-Pro架构设计
众所周知,在摩尔定律的指引下,CPU的多核化、SIMD向量化不断提升着计算机的理论计算性能。然而,简单地增加核心数、增加向量位宽也导致着高性能计算应用的并行效率越来越低、向量指令利用率等优化越来越困难,这成为了制约应用性能提升的最大瓶颈。
曙光此次提出的全新M-Pro架构就是要“反其道而行”,即采用单核性能更加高的Xeon E3-1200 v5系列处理器和Muti-host共享网络技术,配合曙光已有的高密度刀片技术,来设计实际应用性能更高,性价比更好,兼容性更强的服务器。
M-Pro架构的优势
1, E3 v5•强劲的单核性能
“提高CPU的单核计算性能是提升服务器应用性能最直接的手段,这一手段远比增加CPU核数更为有效。”曙光高性能计算产品事业部总工程师,戴荣博士解释说,“大部分高性能计算应用更喜欢主频高、单核性能好的服务器。一般而言,单核性能好,对实际应用就更有利,尤其是对计算、访问存储、通信密集要求高,而并行扩展性一般的应用而言更是如此。”
据了解,M-Pro节点采用Intel最新Skylake架构的Xeon E3-1200 v5系列处理器,该处理器3.0-3.7GHz的主频和更高的单核计算峰值(1.x倍)、更高的单核内存性能(1.x倍)、更高的单核网络带宽(2.x 倍)可提供比普通双路计算节点更为强劲的单核性能,能够更轻松地应对计算密集、访存密集、通信密集型应用。
2, Multi-Host•更先进的高速网络技术
针对普通双路节点上相邻两颗CPU上的进程跨节点通信性能不足且不均匀的问题,曙光选择利用先进的 Multi-Host高速网络技术作为解决方案。基于100Gb/s EDR InfiniBand的Multi-Host技术可以让多个节点共享一个网络设备,该技术已经被Facebook主导OCP组织认定为服务器网络标准。
“1片 CX20-G30 刀片包含2个E3 v5单路节点,2片CX20-G30(4颗CPU)共享一个100Gb/s EDR InfiniBand接口。这样一来,可实现0.6μs超低延迟、单核网络带宽达到6.25Gb/s,是普通双路节点的两倍多。”戴博士解释说,“Multi-Host高速网络技术可使所有CPU上的进程跨节点通信性能均衡,并且节点共享还可降低网络成本。尤其是低至0.6μs的网络延迟正是实际的应用程序所迫切需要的。”
“数据中心相关技术正在进入一个崭新的阶段,其中的网络互连部分正起着越来越重要的作用。Mellanox的Multi-host产品能够帮助曙光 等合作伙伴完成独一无二的可调节且性能优异的服务器解决方案。我们很高兴看到,我们的Multi-host 100G EDR InfiniBand产品能够被曙光M-Pro刀片系列服务器采用。我们坚信这个创新的解决方案将迅速获得市场关注。”迈络思(Mellanox)公司市场副总裁Gilad Shainer先生评价道。
3,一脉相承,上下兼容
近些年服务器市场格局变幻莫测,用户需求也不断提升。刀片服务器比机架服务器占用更少的空间,性能更高。刀片服务器的电路板上设置了关键服务器组件,每个服务器板消除了专用电缆和其他元素,能够为用户节约成本。
曙光的刀片服务器研发可以追溯到2004年,至今已经研制出6代刀片。此次推出的基于M-Pro架构的高密度刀片,不仅能够实现与曙光相关刀片的兼容,还可以实现与普通其他刀片的混插。极大的满足了不同客户多样性的需求。
曙光M-Pro架构发展路线
由于M-Pro服务器具有相同理论峰值下实测应用性能更高、相同投资情况下实测应用性能更好的显著优 势,它已经得到了高性能计算应用和互联网应用用户的着重关注。为了尽快服务客户,针对于高性能计算应用的M-Pro HPC服务器预计将于2016年7月量产。而针对于互联网应用的M-Pro Web服务器预计将于2016年10月量产。据悉,M-Pro Web服务器与M-Pro HPC服务器的主要差别会在网络方面。
M-Pro HPC:看得见的实测应用性能提升和更优的性价比
据测试,M-Pro架构服务器相比普通双路计算节点实测应用性能显著提高。如VASP, OpenMX, Espresso, CPMD, Lammps, WRF的测试数据都展现了近150%的性能提升。从成本角度来说,则相当于为客户节约了~30%的服务器购置投入。
曙光M-Pro架构服务器是一款从客户实际应用出发,采用最先进的处理器和网络技术,进行优化设计出的一款具有相当性价比竞争力的产品。这曙光一直以来秉承的“从客户应用中来,回到用户应用中去”的理念的又一次成功尝试。我们热诚的邀请用户一起来为下一代刀片技术献计献策,一起寻找和实现更加高效的计算解决方案。
更多曙光相关资讯,欢迎搜索微信公众号“中科曙光/sugoncn”,关注曙光公司官方微信,或拨打400-810-0466。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。