12月15日,中国互连技术与产业大会在京开幕,在高通量计算产业联盟和CCF高性能计算专业委员会倡议下发起中国图计算系统性能排行榜工作。会上,高通量计算产业联盟副理事长、CCF高性能计算专委会秘书长张云泉、清华大学翟季冬教授、上海交通大学李超研究员共同公布了首届中国图计算性能TOP100排行榜“China Graph100”。

首届中国图计算性能TOP100排行榜“China Graph100”发布
在China Graph100能效榜上,中科院计算所和北京中科睿芯科技集团有限公司(简称中科睿芯)研发的高通量图计算系统以1830.31MTEPS/Watt的成绩荣获第一,它不仅是中国能效最高的图计算系统,同时在国际评测组织Green Graph500榜上也蝉联第一。

中科院计算所和中科睿芯研发的高通量图计算系统荣获China Graph100能效榜第一
在China Graph100性能榜上,部署在国家超级计算无锡中心的“神威·太湖之光”以23755.7GTEPS(TEPS即每秒遍历的边数目,G代表109次)的遍历性能排名第一;部署在国家超级计算广州中心的“天河二号”以2061.48GTEPS的遍历性能排名第二;位列榜单第三位的是由中科院计算所和中科睿芯联合研制的“金刚”高通量集群,与榜上同等性能的结果相比,高通量集群服务器数量减少了99%以上,展现了优越的高通量计算能力和超高的节点效率。

中科院计算所和中科睿芯联合研制的“金刚”高通量集群荣获China Graph100性能榜第三
张云泉介绍说,China Graph100榜单依据在计算机系统上执行宽度优先搜索(BFS)的遍历性能,来对中国最快的图计算系统进行排序。目前,China Graph100是衡量中国图计算机系统和解决实际图应用性能的重要参考依据。
填补中国图计算性能排行空白
作为表达和处理关联关系的最佳方式,图计算已经成为大数据处理领域的研究热点,广泛应用于金融分析、社交分析、生物信息、智能交通等诸多领域。
排在本次榜单前三位的图计算系统性能出众。其中,“金刚”高通量系统表现尤为出众,不单在能效榜单排名第一,更是仅以72节点就完成了235(顶点数)的大规模图数据处理,达到249.73GTEPS的性能,虽性能榜排名第三,但相较于前两名,我们深刻看到了高通量计算机系统以千分之一不到的资源投入就实现超优性能背后所体现的在低功耗和高并发方面的无限潜力和优势。
基于“神威·太湖之光”平台研制的超大规模图计算框架,在消息聚合、转发等方面做了优化,使其图计算规模在240(顶点数,下同)、用40768个节点可达到23755.7GTEPS的性能。国防科技大学团队在“天河2号”超级计算机上利用8192节点,在图规模为236时取得2061.48GTEPS的性能成绩。
目前,国际上面向图计算等数据密集型应用的评测榜单仅有Graph500。Graph500始于2010年,排名每年更新2次(6月和11月)。国内在此前尚无针对图计算性能的排行榜单,China Graph100的发布填补了这一空白。
谈及发起中国图计算性能排行榜工作,张云泉表示,榜单的测定与发布有助于推动我国面向图计算的计算机系统研究,带动图计算专用加速器、系统软件、算法和优化技术发展和产业化进程。
推动中国图计算发展
超级计算机评测榜单的全球性发布对计算机技术及应用的推动作用有目共睹。已经连续发布了56届的超算TOP500榜单,有力地带动了世界高性能领域硬件的快速发展;始于2002年的中国HPC TOP100排行榜,进一步加速了我国高性能超级计算机的研制。
在图计算领域,Graph500排行榜通过执行图算法来评测计算机系统处理数据密集型应用的能力。自2010年发布以来,Graph500得到了世界各国的支持,推动了通用图计算系统的发展。然而,我国参与Graph500榜单排名的机器却只有20个左右,这在一定程度上反映了我国在图计算领域的研究工作还比较薄弱。
在国家科技部关于图计算和高通量计算项目的支持下,我国图计算事业有了显著的发展。华中科技大学金海教授、清华大学陈文光教授、华中科技大学廖小飞教授、北京大学邹磊教授等一大批优秀学者纷纷投身这一领域,为我国图计算事业开疆拓土。
珠玉在前,China Graph100榜单的发布旨在为中国图计算发展鼓呼。业内人士表示,China Graph100榜单的发布,将吸引更多的高校院所、企业机构加入大规模图计算系统的研制,进而推动面向图计算的新型体系结构和图应用算法的研究。
据介绍,继此次榜单发布后,China Graph100排行榜将在每年1~11月进行数据收集,于12月进行榜单更新。未来,China Graph100榜单不仅将展现我国高性能图计算机领域的发展概况,还将成为我国计算事业发展的重要注脚。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。