12月15日,中国互连技术与产业大会在京开幕,在高通量计算产业联盟和CCF高性能计算专业委员会倡议下发起中国图计算系统性能排行榜工作。会上,高通量计算产业联盟副理事长、CCF高性能计算专委会秘书长张云泉、清华大学翟季冬教授、上海交通大学李超研究员共同公布了首届中国图计算性能TOP100排行榜“China Graph100”。
首届中国图计算性能TOP100排行榜“China Graph100”发布
在China Graph100能效榜上,中科院计算所和北京中科睿芯科技集团有限公司(简称中科睿芯)研发的高通量图计算系统以1830.31MTEPS/Watt的成绩荣获第一,它不仅是中国能效最高的图计算系统,同时在国际评测组织Green Graph500榜上也蝉联第一。
中科院计算所和中科睿芯研发的高通量图计算系统荣获China Graph100能效榜第一
在China Graph100性能榜上,部署在国家超级计算无锡中心的“神威·太湖之光”以23755.7GTEPS(TEPS即每秒遍历的边数目,G代表109次)的遍历性能排名第一;部署在国家超级计算广州中心的“天河二号”以2061.48GTEPS的遍历性能排名第二;位列榜单第三位的是由中科院计算所和中科睿芯联合研制的“金刚”高通量集群,与榜上同等性能的结果相比,高通量集群服务器数量减少了99%以上,展现了优越的高通量计算能力和超高的节点效率。
中科院计算所和中科睿芯联合研制的“金刚”高通量集群荣获China Graph100性能榜第三
张云泉介绍说,China Graph100榜单依据在计算机系统上执行宽度优先搜索(BFS)的遍历性能,来对中国最快的图计算系统进行排序。目前,China Graph100是衡量中国图计算机系统和解决实际图应用性能的重要参考依据。
填补中国图计算性能排行空白
作为表达和处理关联关系的最佳方式,图计算已经成为大数据处理领域的研究热点,广泛应用于金融分析、社交分析、生物信息、智能交通等诸多领域。
排在本次榜单前三位的图计算系统性能出众。其中,“金刚”高通量系统表现尤为出众,不单在能效榜单排名第一,更是仅以72节点就完成了235(顶点数)的大规模图数据处理,达到249.73GTEPS的性能,虽性能榜排名第三,但相较于前两名,我们深刻看到了高通量计算机系统以千分之一不到的资源投入就实现超优性能背后所体现的在低功耗和高并发方面的无限潜力和优势。
基于“神威·太湖之光”平台研制的超大规模图计算框架,在消息聚合、转发等方面做了优化,使其图计算规模在240(顶点数,下同)、用40768个节点可达到23755.7GTEPS的性能。国防科技大学团队在“天河2号”超级计算机上利用8192节点,在图规模为236时取得2061.48GTEPS的性能成绩。
目前,国际上面向图计算等数据密集型应用的评测榜单仅有Graph500。Graph500始于2010年,排名每年更新2次(6月和11月)。国内在此前尚无针对图计算性能的排行榜单,China Graph100的发布填补了这一空白。
谈及发起中国图计算性能排行榜工作,张云泉表示,榜单的测定与发布有助于推动我国面向图计算的计算机系统研究,带动图计算专用加速器、系统软件、算法和优化技术发展和产业化进程。
推动中国图计算发展
超级计算机评测榜单的全球性发布对计算机技术及应用的推动作用有目共睹。已经连续发布了56届的超算TOP500榜单,有力地带动了世界高性能领域硬件的快速发展;始于2002年的中国HPC TOP100排行榜,进一步加速了我国高性能超级计算机的研制。
在图计算领域,Graph500排行榜通过执行图算法来评测计算机系统处理数据密集型应用的能力。自2010年发布以来,Graph500得到了世界各国的支持,推动了通用图计算系统的发展。然而,我国参与Graph500榜单排名的机器却只有20个左右,这在一定程度上反映了我国在图计算领域的研究工作还比较薄弱。
在国家科技部关于图计算和高通量计算项目的支持下,我国图计算事业有了显著的发展。华中科技大学金海教授、清华大学陈文光教授、华中科技大学廖小飞教授、北京大学邹磊教授等一大批优秀学者纷纷投身这一领域,为我国图计算事业开疆拓土。
珠玉在前,China Graph100榜单的发布旨在为中国图计算发展鼓呼。业内人士表示,China Graph100榜单的发布,将吸引更多的高校院所、企业机构加入大规模图计算系统的研制,进而推动面向图计算的新型体系结构和图应用算法的研究。
据介绍,继此次榜单发布后,China Graph100排行榜将在每年1~11月进行数据收集,于12月进行榜单更新。未来,China Graph100榜单不仅将展现我国高性能图计算机领域的发展概况,还将成为我国计算事业发展的重要注脚。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。