榜单发布人、清华大学计算机系长聘翟季冬教授介绍说,AIPerf是面向智能算力评估的国际性排行榜,其于2020年首次在中国超级算力大会上发布榜单。相比传统超算性能排行榜,AIPerf榜单是对智能算力评测领域的有效补充。


清华大学翟季冬教授发布AIPerf榜单
“中国的智算、超算等算力发展非常迅速,许多省市都建设了智算中心。”翟季冬说,对于公众而言,人们需要一个简单明晰的指标来了解“哪个智算中心的算力更强”“智算中心的算力到底如何”等问题,AIPerf就是在此背景下诞生的。
今年的AIPerf延续了2024年的做法,包含三部分:采用经典卷积模型评价智能算力训练性能的AIPerf、以大语言模型训练效果评价智能算力性能的AIPerf-LLM、以大模型推理效能评价智能算力性能的AIPerf-Inference。
据介绍,AIPerf测试程序具有“提供一个分数”“可变计算规模”“计算有人工智能意义”“多机通信可以少但不能没有”等特点,其得分结果对于可测评系统的训练性能有直观反映。
在今年的排行榜上,北京超级云计算中心提交的两台新机器榜上有名,分别位列该榜单第一、第三位。作为,位于榜首的“新面孔”,北京超级云计算中心以NVIDIA RTX5090打造的系统,共有1194个节点,总卡数近万张;此前的榜首、由鹏城实验室与华为公司联合打造的AI计算系统——“鹏城云脑II”屈居次席。
基于AIPerf-LLM,翟季冬发布了以“大模型训练能力”作为区分的算力排行榜。在可测的若干智能计算系统中,北京超级云计算中心、阿里云部署在复旦大学的智算集群等位列前茅。
AIPerf-Inference有两个榜单,分别为“吞吐榜”和“延迟榜”,以适应不同推理任务的不同特征需要。其中,在“吞吐榜”上,北京超级云计算中心2台智算系统、新疆数算电科技技术有限责任公司和北京清程极智科技有限公司共同开发的系统位列榜单 Top3。

张云泉研究员和翟季冬教授为上榜单位(部分)颁发证书
随着AI的发展,我们计划增加一个以大模型Tokens调用性能为评测基准的榜单AIPing (aiping.cn),评测不同MaaS平台的服务性能。现在还在筹划阶段,希望征求一下同行领域专家的建议。翟季冬说,目前团队已经在这方面做了一些准备和测试工作,“今年只是抛一个砖,未来希望有更多的MaaS(模型作为服务)平台开展性能测试”。
好文章,需要你的鼓励
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Adobe报告2025年创纪录营收237.7亿美元,同比增长11%,主要归功于AI技术。尽管股价今年下跌超37%,但公司年利润实现增长。CEO表示Adobe在全球AI生态系统中重要性日益凸显,AI相关年度经常性收入已占总业务三分之一以上。公司计划2026年ARR增长10.2%,并与AWS、微软、谷歌等建立AI生态合作伙伴关系。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。