近日,中科曙光公司的全球首款Multi-Host InfiniBand服务器M-Pro 新品发布,该产品与曙光金牌刀片服务器TC4600E完美融合实现量产。
去年在ISC16上,曙光公司全球首次发布了“M-Pro”架构服务器——Multi-Hosted Multi-Processor,成为ISC2016新产品板块的耀眼新星。据统计,该产品量产以来已经有大量出货,成为关注性价比客户的首选。
本次发布的新产品同样利用了Multi-Host技术,实现两个Intel Xeon E5-2600 v3/v4、SkyLake双路计算刀片共享100Gb/s高速网络,相比传统的56Gbps方案,在保证原有带宽的同时,有效降低了网络延迟,并且可缩减网络规模,大幅度的提高性价比。
相比于传统的56Gb/s方案,M-Pro家族新成员有以下几点技术特色:
系统整体延迟低:近年来对高性能系统的监控数据分析表明,应用对延迟的高低相比如带宽而言还依然非常敏感。“M-Pro”新成员延迟水平与100Gb/s 网络保持一致,有效降低延迟。另外通过网络共享技术,可将高速网络规模缩减一半,如传统的系统规模如果多于648节点一般采用3层胖树组网,而基于网络共享技术的组网单台大交换机可支撑1296个节点,跳数也由原来的5条减少到3跳,进一步降低延迟。
性价比出色:由于网络共享技术可将网络规模缩减一半,整体投资可节约30%以上。另外由于线缆和网络设备的数量降低一半以上,使得系统的故障率及维护成本大大降低。
一脉相承,上下兼容:近些年服务器市场格局变幻莫测,用户需求也不断提升。刀片服务器比机架服务器占用更少的空间,性能更高。刀片服务器的电路板上设置了关键服务器组件,每个服务器板消除了专用电缆和其他元素,能够为用户节约成本。曙光的刀片服务器研发可以追溯到2004年,至今已经研制出6代刀片。此次推出的基于M-Pro架构的高密度刀片,不仅能够实现与曙光相关刀片的兼容,还可以实现与普通其它刀片的混插。极大的满足了不同客户多样性的需求。
M-Pro产品回顾
“M-Pro”产品是曙光在2016年推出的一款针对高性能计算优化的计算平台,其优秀的设计与强大的性能,在众多竞争对手中脱颖而出,得到市场的广泛认可,服务于各类超算中心、气象预报、科研教育、工程设计等用户单位。
巧妙的M-Pro架构设计
众所周知,在摩尔定律的指引下,CPU的多核化、SIMD向量化不断提升着计算机的理论计算性能。然而,增加核心数、增加向量位宽也导致高性能计算应用的并行效率、向量指令利用率等优化越来越困难,这成为了制约应用性能提升的最大瓶颈。
曙光提出的全新M-Pro架构就是要“反其道而行”,即采用单核性能更加高的处理器和Multi-Host共享网络技术,来设计实际应用性能更高、性价比更好、兼容性更强的高性能计算服务器。
M-Pro架构的优势
强劲的单核性能:采用IntelXeon E3-1200 v5/v6系列处理器,该处理器具有更高的主频、更高的单核内存性能,能够更轻松地应对计算密集、访存密集、通信密集型应用。
Multi-Host更先进的高速网络技术:针对传统的双路节点上相邻两颗CPU上的进程跨节点通信性不均衡问题,曙光采用Multi-Host高速网络技术作为解决方案,所有CPU都直连到共享100Gb/s网络上,CPU间是对等的关系,性能更卓越。
看得见的实测应用性能提升和更优的性价比
据测试,M-Pro 架构服务器相比普通双路计算节点实测应用性能显著提高。如VASP, CASTEP, Espresso, Fluent, NAMD, WRF的测试数据都展现了近150%的性能提升。从成本角度来说,则相当于为客户节约了30%以上的服务器购置投入。
曙光M-Pro架构服务器是一款从客户实际应用出发,采用最先进的处理器和网络技术,进行优化设计出的一款具有相当性价比竞争力的产品, 已经支持E3-1200 v5/v6, E5-2600 v3/v4, SkyLake等多款CPU。这是曙光一直以来秉承的“从客户应用中来,回到用户应用中去”的理念的又一次成功尝试。我们热诚的邀请用户一起来为下一代刀片技术献计献策,一起寻找和实现更加高效的计算解决方案。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。