第50届全球超算TOP500榜单在美国丹佛的全球超算大会(SC17)上揭晓。由于自上一期榜单(6月)发布以来没有更快的超级计算机诞生,排在榜首的仍然是来自中国的“神威·太湖之光”,实现“四连冠”;昔日冠军“天河二号”紧随其后。
此外,在这份榜单中,中国超算跻身全球500强的席位数由6个月前的160套升至202套,美国由169套降至143套。这也是继2016年6月中国超算份额以微弱优势(167:165套)超越美国后,首次以显著优势大幅超越美国(202:143套)。至此,美国HPC份额跌至榜单25年来最低点。曙光等3家中国厂商与2家美国厂商共同进入前五名,且占据了榜单份额的72.6%(363套),数量遥遥领先于其它厂商。
中国能在TOP500榜单中有如此亮眼表现,既反映了国家经济实力和创新能力的提升,也说明了十三五期间,中国研发与生产活力双双强劲。尤其是互联网领域对计算的旺盛需求让中国超算实现了对美国的大幅超越。
不得不提的是,TOP500排名所基于的Linpack性能主要考验超算系统的处理器性能,但近年来业界已经注意到,过于强调CPU性能会导致重视系统的规模堆积而忽略真实性能效率,因此开始使用HPCG性能来全面评价超算系统。HPCG更看重实际应用性能,对内存系统、网络延迟等因素考虑更全面。从本次TOP500榜单上来看,共61套系统提交了HPCG值,其中美国、日本、中国分别占17、10和6套;另外,61套系统中,有51套都用于HPC传统科研与工程计算领域,占比83.6%,这也反映出传统HPC应用比互联网类应用更注重系统综合性能和效率,同时也回应了近年来互联网系统大规模进军各类超算排行榜所引发的争议——超算榜单应重视超算系统的实际性能和效率,而不仅仅是评估规模和处理器性能。
因此,虽然中国超算在互联网等新兴应用领域快速增长,但纵观国际市场和国内经济形势,中国HPC在传统领域应用上依然具有很大的成长空间。 “从长远来看,随着市场的成熟,互联网应用和传统科研与工程计算应用的比例应该会趋于接近”,曙光公司高性能计算产品事业部总经理李斌表示,“我们期待中国超算在各行业的应用能够全面、均衡的发展,这样中国才能成为真正意义上的超算行业领跑者”。
对榜单的进一步分析表明,在涉及中国传统HPC应用领域的6个厂商中,曙光公司的份额超过了1/3,继续保持大幅领先于其它厂商。作为中国高性能计算领军企业,曙光公司多年来在HPC领域拥有深厚的技术积累,着重技术创新与产业化应用。在本次
SC17大会上,曙光公司发布了全球首款面向E级计算的Torus硅元交换机、展示了中国最先进的冷板式液冷服务器TC4600E-LP以及全球性能领先的人工智能服务器SuperBox。未来,曙光公司仍将大力发展以高性能计算为代表的先进计算技术。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。