榜单发布人、清华大学计算机系长聘翟季冬教授介绍说,AIPerf是面向智能算力评估的国际性排行榜,其于2020年首次在中国超级算力大会上发布榜单。相比传统超算性能排行榜,AIPerf榜单是对智能算力评测领域的有效补充。


清华大学翟季冬教授发布AIPerf榜单
“中国的智算、超算等算力发展非常迅速,许多省市都建设了智算中心。”翟季冬说,对于公众而言,人们需要一个简单明晰的指标来了解“哪个智算中心的算力更强”“智算中心的算力到底如何”等问题,AIPerf就是在此背景下诞生的。
今年的AIPerf延续了2024年的做法,包含三部分:采用经典卷积模型评价智能算力训练性能的AIPerf、以大语言模型训练效果评价智能算力性能的AIPerf-LLM、以大模型推理效能评价智能算力性能的AIPerf-Inference。
据介绍,AIPerf测试程序具有“提供一个分数”“可变计算规模”“计算有人工智能意义”“多机通信可以少但不能没有”等特点,其得分结果对于可测评系统的训练性能有直观反映。
在今年的排行榜上,北京超级云计算中心提交的两台新机器榜上有名,分别位列该榜单第一、第三位。作为,位于榜首的“新面孔”,北京超级云计算中心以NVIDIA RTX5090打造的系统,共有1194个节点,总卡数近万张;此前的榜首、由鹏城实验室与华为公司联合打造的AI计算系统——“鹏城云脑II”屈居次席。
基于AIPerf-LLM,翟季冬发布了以“大模型训练能力”作为区分的算力排行榜。在可测的若干智能计算系统中,北京超级云计算中心、阿里云部署在复旦大学的智算集群等位列前茅。
AIPerf-Inference有两个榜单,分别为“吞吐榜”和“延迟榜”,以适应不同推理任务的不同特征需要。其中,在“吞吐榜”上,北京超级云计算中心2台智算系统、新疆数算电科技技术有限责任公司和北京清程极智科技有限公司共同开发的系统位列榜单 Top3。

张云泉研究员和翟季冬教授为上榜单位(部分)颁发证书
随着AI的发展,我们计划增加一个以大模型Tokens调用性能为评测基准的榜单AIPing (aiping.cn),评测不同MaaS平台的服务性能。现在还在筹划阶段,希望征求一下同行领域专家的建议。翟季冬说,目前团队已经在这方面做了一些准备和测试工作,“今年只是抛一个砖,未来希望有更多的MaaS(模型作为服务)平台开展性能测试”。
好文章,需要你的鼓励
埃森哲投资AI零售平台Profitmind,该平台通过智能代理自动化定价决策、库存管理和规划。研究显示AI驱动了2025年假日购物季20%的消费,约2620亿美元。部署AI代理的企业假日销售同比增长6.2%,而未部署的仅增长3.9%。Profitmind实时监控竞争对手价格和营销策略,并可创建生成式引擎优化产品文案。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
日立公司在CES 2026技术展上宣布了重新定义人工智能未来的"里程碑式"战略,将AI直接应用于关键物理基础设施。该公司与英伟达、谷歌云建立重要合作伙伴关系,并扩展其数字资产管理平台HMAX,旨在将AI引入社会基础设施,变革能源、交通和工业基础设施领域。日立强调其独特地位,能够将AI集成到直接影响社会的系统中,解决可持续发展、安全和效率方面的紧迫挑战。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。