一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变 原创

在这样一个节点,一张“慢”的榜单,其发布的意义何在?

11月的北京,空气中弥漫着冷意。在第七届中国超级算力大会(ChinaSC 2025)的现场,当中国科学院计算技术研究所的张云泉研究员走上台时,台下的人们都在等待一个延续了24年的“仪式”——中国高性能计算机性能TOP100榜单的发布。这本应是每年“秀肌肉”的时刻,但作为榜单作者之一的张云泉,却选择了一种近乎“坦白”的开场。

一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变

张云泉 全国政协委员 中国科学院计算技术研究所 研究员

“大家知道出于一些特殊的原因,这两年的数据(指上榜TOP100的机器)更新得比较缓慢。” 张云泉的话音沉稳,却直指要害。地缘政治的压力、技术封锁的“特殊原因”,让这张榜单的更新速度肉眼可见地放缓了。在这样一个节点,一张“慢”的榜单,其发布的意义何在?

“事物的发展有不同阶段,”张云泉紧接着说,“我们坚持发榜二十多年,终将越过寒冬、迎来春天,中国超算也会再次勃发,我相信这个时间不会太远。”这份近乎“执拗”的坚持,为大会定下了基调。

一张“平静”的榜单:HPC TOP100的“不变”与“水下冰山”

自2002年第一份榜单发布以来,中国HPC TOP100已经连续发布了24年。它见证了从“天河一号”到“神威·太湖之光”的时代跃迁,也见证了当下的平静——与2024年相比,前十名机器没有变化。

榜首仍是2023年部署于某超算中心、性能487.94 PFLOPS的主机系统。而“神威·太湖之光”和“天河二号”这样的“老将”,在今年的榜单中仍稳列第四和第六位。榜单的“门槛”也仅是微小的提升。第100名的性能从去年的2.060 PFLOPS小幅提升至2.071 PFLOPS。

但平静并非停滞。榜单上仍有新生的火种:位列第13的陕西智算云谷新增机器,以及第47位的北京超级云计算中心M9分区。

从“上榜数量”看,联想以43台系统排名第一 ;但如果从“性能份额”来看,一个惊人的数据出现了——“未公布具体研制单位信息的机器”性能占比超过71.45%。这似乎也呼应了近两年榜单更新缓慢的特殊原因,中国的顶尖算力,正潜伏于“水下冰山”。

另一座“战场”:AIPerf500的“换榜”与“新规”

与HPC TOP100的“静”形成鲜明对比的,是AI算力榜单的“动”。在大会下午的议程中,《2025国际人工智能性能 AIPerf500排行榜》迎来了“改朝换代”。

清华大学计算机系教授翟季冬走上讲台,介绍这份由中、美、欧多位科学家共同发起的国际榜单。AIPerf面向AI算力评测,于2020年首次亮相,相比传统超算性能排行榜,AIPerf榜单是对智能算力评测领域的有效补充。

一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变

翟季冬 清华大学教授发布并解读《2025国际人工智能性能AIPerf500排行榜》

“公众想知道,哪个智算中心算力更强?智算中心的算力到底如何?AIPerf就是为此而生。”翟季冬说。

从榜单结果看,北京超级云计算中心提交的两台新机器分别位列榜单第一和第三位。榜首是以NVIDIA RTX5090打造的系统,共有1194个节点,总卡数近万张。而去年冠军“鹏城云脑II”屈居次席。

值得关注的一点是,AI赛道的“规则”正在快速演化。AIPerf不再是一个笼统的榜单,而是细分出了三个战场:采用经典卷积模型评价训练性能的AIPerf 、以大语言模型训练效果评价性能的AIPerf-LLM ,以及以大模型推理效能评价性能的AIPerf-Inference。

此外,翟季冬还在现场透露,团队正在筹划一个新的指标——AIPing,以大模型Tokens调用性能为基准,用于评测各类MaaS(模型即服务)平台。这也标志着竞争正逐渐从“建算力”转向“用算力”。

“今年只是抛一个砖。”翟季冬笑着说,“希望未来有更多平台愿意接受性能测试。”

“寒冬”的震中:“CUDA”之锁与“九源”之匙

无论是“慢”的HPC还是“快”的AI,两张榜单都指向了一个共同的“阿喀琉斯之踵”——生态。

中国工程院院士郑纬民的报告,揭示了当前中国智算产业面临的最尖锐悖论。他复述了自己前两天与并行科技董事长陈健的一场聊天。

一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变

郑纬民 中国工程院院士 清华大学教授

“我问:‘现在智能算力的需求怎么样?’他说:‘非常旺。’”郑纬民在台上分享道,“他说现在如果你有512块卡,1000块卡,2000块卡更好,马上有人要租你这个卡。他跟我说已经有一礼拜租不着。”

“他租的什么卡呢?是英伟达卡。”郑纬民话锋一转,“我也非常理解……国产卡还是有的,但是人家要租的是英伟达卡,为什么不租国产的卡?问题在哪儿?”

答案直指“CUDA”生态。郑纬民指出:“大多数软件是基于英伟达CUDA写的,在国产卡上一下子转不起来……你要转起来要做移植……没有几个月,甚至半年是移不过来的。”

这便是“英伟达租不到,国产卡用不上”的“CUDA之锁”。而郑纬民和他背后的启元实验室,带来的正是一把“钥匙”——“九源统一智能计算平台”。

郑纬民强调,“九源”的核心不是“烟囱式”的一对一适配,而是“平台式”的统一架构 。其目标是通过统一的算子库、通讯库、编程语言与运行时,屏蔽底层(如天数、沐曦、摩尔线程、寒武纪、昇腾、昆仑芯等 )国产芯片的异构差异。

“我们是平台式的,”郑院士总结道,“一套代码统一适配,各个异构国产级别的,不需要修改就可以运行。”

为了推动这一目标,大会现场,启元实验室联合上海人工智能实验室等伙伴,正式启动了《九源智能计算系统生态联合体》。

一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变

《九源智能计算系统生态联合体》启动仪式

“春天”的信号:“超智融合”与“产业造轮”

在“九源”这样的顶层设计试图“一统江湖”之前,产业界已经开始“不等不靠”,在具体的应用场景中“造轮子”,寻找“春天”的入口。

“石油CT”的国产突围

东方物探公司的GeoEast软件系统,是东方物探历经20多年研发、具有完全自主知识产权的大型地震处理解释一体化软件。物探技术研究中心软件技术研发部主任尚民强在报告中提及,早在20年前,国外就开始对物探软件进行封锁。如今,他们与华为联合推进GeoEast鲲鹏平台适配,攻克了代码复杂、精度要求高的难题。双方还联合创新了AI4S(AI for science)地震正反演大模型。尚民强透露,“传统全波形反演用500台高性能服务器,算一块不到1T的数据大概需要三个月,而AI模型的引入,使计算效率提升了10多倍。”

一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变

尚民强 东方物探公司物探技术研究中心软件技术研发部主任

“响尾蛇”的内生智能

中科曙光高性能计算产品事业部副总经理刘冠川则围绕“超算系统”“内生智能”的概念做了分享。他用“响尾蛇”(一条蛇咬住自己的尾巴)这一神话符号来比喻“自我吞噬、再生、突变、演化”,即超算系统通过AI实现“自主优化演进”。他举了一个生动的例子:当AI预判到即将运行一个整机高压的Linpack测试时,“它会提前十分钟把后端的制冷系统先提前启动,使任务真正跑起来的时候先后能够衔接上。”

一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变

刘冠川 中科曙光高性能计算产品事业部副总经理

“绿电”的新牌桌

HPC TOP100榜单的新星“安康智算中心”,则代表了另一种“破局”思路。陕西安康机场投资有限公司总经理钟玮坦言,安康并非国家“东数西算”的八大枢纽节点,但精准定位为“西算重要生态补位区”。他们最大的“王牌”是绿色能源:安康绿电占比超90%,PUE值可降至1.25以下,运营成本“比东部地区低30%以上”。当算力竞争进入“下半场”,能耗与碳足迹正成为新的“牌桌”规则。

一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变

钟玮 陕西安康机场投资有限公司总经理

散热的“最后一公里”

如果说安康解决了“大电”的问题,北京华弘数科则瞄准了“最后一公里”的散热。总经理罗华提出,AI发展面临“桌面高端算力稀缺”的困局,而破局关键是“全液冷驱动超算与智算的深度融合”。大会现场,华弘数科联合中科院计算所、网络中心等机构,发布了“全液冷多场景一体化平台”,试图从物理层面解决高密度算力的散热瓶颈。

一张“慢”榜单与一场“快”战争:中国算力排行榜的变与不变

罗华 北京华弘数科技术有限公司总经理

ChinaSC 2025大会所呈现的,正是穿越周期的战略全景:以“HPC TOP100”守住“面子”,以“AIPerf500”争夺“里子”;以“九源”平台构筑“底座”,以产业应用点燃“引擎”。那张“慢”榜单,或许不是因为“没有”,而是为了更好地“隐藏”;而那份“执拗”的坚守 ,是为了在“春天”到来时,中国超算不仅在“牌桌”上,而且手握“新规”。

来源:至顶网计算频道

0赞

好文章,需要你的鼓励

2025

11/21

11:51

分享

点赞

邮件订阅