近日,中科曙光公司的全球首款Multi-Host InfiniBand服务器M-Pro 新品发布,该产品与曙光金牌刀片服务器TC4600E完美融合实现量产。
去年在ISC16上,曙光公司全球首次发布了“M-Pro”架构服务器——Multi-Hosted Multi-Processor,成为ISC2016新产品板块的耀眼新星。据统计,该产品量产以来已经有大量出货,成为关注性价比客户的首选。
本次发布的新产品同样利用了Multi-Host技术,实现两个Intel Xeon E5-2600 v3/v4、SkyLake双路计算刀片共享100Gb/s高速网络,相比传统的56Gbps方案,在保证原有带宽的同时,有效降低了网络延迟,并且可缩减网络规模,大幅度的提高性价比。
相比于传统的56Gb/s方案,M-Pro家族新成员有以下几点技术特色:
系统整体延迟低:近年来对高性能系统的监控数据分析表明,应用对延迟的高低相比如带宽而言还依然非常敏感。“M-Pro”新成员延迟水平与100Gb/s 网络保持一致,有效降低延迟。另外通过网络共享技术,可将高速网络规模缩减一半,如传统的系统规模如果多于648节点一般采用3层胖树组网,而基于网络共享技术的组网单台大交换机可支撑1296个节点,跳数也由原来的5条减少到3跳,进一步降低延迟。
性价比出色:由于网络共享技术可将网络规模缩减一半,整体投资可节约30%以上。另外由于线缆和网络设备的数量降低一半以上,使得系统的故障率及维护成本大大降低。
一脉相承,上下兼容:近些年服务器市场格局变幻莫测,用户需求也不断提升。刀片服务器比机架服务器占用更少的空间,性能更高。刀片服务器的电路板上设置了关键服务器组件,每个服务器板消除了专用电缆和其他元素,能够为用户节约成本。曙光的刀片服务器研发可以追溯到2004年,至今已经研制出6代刀片。此次推出的基于M-Pro架构的高密度刀片,不仅能够实现与曙光相关刀片的兼容,还可以实现与普通其它刀片的混插。极大的满足了不同客户多样性的需求。
M-Pro产品回顾
“M-Pro”产品是曙光在2016年推出的一款针对高性能计算优化的计算平台,其优秀的设计与强大的性能,在众多竞争对手中脱颖而出,得到市场的广泛认可,服务于各类超算中心、气象预报、科研教育、工程设计等用户单位。
巧妙的M-Pro架构设计
众所周知,在摩尔定律的指引下,CPU的多核化、SIMD向量化不断提升着计算机的理论计算性能。然而,增加核心数、增加向量位宽也导致高性能计算应用的并行效率、向量指令利用率等优化越来越困难,这成为了制约应用性能提升的最大瓶颈。
曙光提出的全新M-Pro架构就是要“反其道而行”,即采用单核性能更加高的处理器和Multi-Host共享网络技术,来设计实际应用性能更高、性价比更好、兼容性更强的高性能计算服务器。
M-Pro架构的优势
强劲的单核性能:采用IntelXeon E3-1200 v5/v6系列处理器,该处理器具有更高的主频、更高的单核内存性能,能够更轻松地应对计算密集、访存密集、通信密集型应用。
Multi-Host更先进的高速网络技术:针对传统的双路节点上相邻两颗CPU上的进程跨节点通信性不均衡问题,曙光采用Multi-Host高速网络技术作为解决方案,所有CPU都直连到共享100Gb/s网络上,CPU间是对等的关系,性能更卓越。
看得见的实测应用性能提升和更优的性价比
据测试,M-Pro 架构服务器相比普通双路计算节点实测应用性能显著提高。如VASP, CASTEP, Espresso, Fluent, NAMD, WRF的测试数据都展现了近150%的性能提升。从成本角度来说,则相当于为客户节约了30%以上的服务器购置投入。
曙光M-Pro架构服务器是一款从客户实际应用出发,采用最先进的处理器和网络技术,进行优化设计出的一款具有相当性价比竞争力的产品, 已经支持E3-1200 v5/v6, E5-2600 v3/v4, SkyLake等多款CPU。这是曙光一直以来秉承的“从客户应用中来,回到用户应用中去”的理念的又一次成功尝试。我们热诚的邀请用户一起来为下一代刀片技术献计献策,一起寻找和实现更加高效的计算解决方案。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。