在经历五年多的落后之后,如今美国终于在超级计算机领域再度超越中国,重夺头名桂冠。
这台由IBM公司为田纳西州橡树岭国家实验室建造的Summit超级计算机(如上图所示)在本周一发布的全球超算五百强中位列第一(这份榜单每年发布两轮,列举世界上五百台最为强大的非分布式计算机设备)。这一消息在本周于德国法兰克福举行的年度国际超级计算机大会上正式公布。
除了美中之间的竞争之外,该计算机对英伟达公司图形处理单元的大量运用同样值得关注——这些处理单元最初是为了加速视频游戏图形而创建。目前,全球速度最快的七台超级计算机中有五台都使用有英伟达的Tensor Core GPU,Summit自然也不例外。
之所以要在全球性能最为强劲的计算机设备中大量使用GPU,是因为GPU能够并行处理大量数据,从而有力支持高性能计算与人工智能需求。这样的速度提升抵消了摩尔定律放缓的问题(摩尔定律认为芯片密度每一到两年将能够增加一倍,这一结论在过去数十年中一直有效,但最近却逐渐走向终点)。利用GPU解决问题,在难度上明显低于转变传统芯片加工与制造工艺。
另外,英特尔公司的主流至强处理器仍出现在绝大多数超级计算机当中——超算五百强中有95%使用至强处理器,新上榜超算的至强使用比例更是高达97%。
尽管如此,GPU的数量增长才是这些超级计算机算力提升的主干。英伟达公司表示,在五百强超算当中,其每秒浮点运算速度(计算能力的标准单位)占比如下:英伟达新一代Tesla V100目前占比56%,高于去年上一代Tesla P100的25%,更远高于2015年Tesla K80的11%。而在Summit超级计算机当中,GPU贡献的算力更是达到了惊人的95%。
Summit的成功可以说在意料之中。就在本月早些时候,超算五百强网站就已经报道称其峰值速度达到了200千万亿次——计算速度单位相当于每秒4千万亿次浮点运算。事实证明,根据超算五百强组织的实际衡量,其稳定性能水平约在120千万亿次。
这已经足以击败上届超算五百强冠军,目前排名第二的中国神威-太湖之光——其计算能力可达93千万亿次。第三名则为IBM公司为美国能源部劳伦斯利弗莫尔国家实验室构建的Sierra。
Summit采用令人难以置信的27648块Tensor Core GPU外加9216块IBM处理器的组合,因此在处理AI、机器学习与深度学习神经网络时优势明显。在超算五百强当中,另有17台超算设备采用同样的GPU,其中包括Sierra以及日本与欧洲速度最快的超级计算机。
超级计算机被用于解决世界上最具挑战的难题,包括预测天气、分析材料、探索超导体甚至基于遗传基因分析过敏病症等。
英伟达公司副总裁兼加速计算总经理Ian Buck在上周五的新闻发布会上表示,“对于高性能计算而言,这无疑是个令人激动的时刻。这些新的AI超级计算机将重新定义计算的未来。”
尽管美国目前重夺头名,但总体来看其在超算领域的地位仍处于下降态势——至少超算五百强的上榜系统数量有所减少。其目前只有124套系统位列五百强,处于历史新低点——低于6个月前的145套。与此同时,中国的整体上榜超算数量则为206套,略高于去年的202套。
英伟达公司还宣布,自去年推出以来,其GPU云服务中的软件容器数量已经增加至三倍,达到35个。容器是一种应用程序的打包方法,能够立足内部数据中心与云端实现立足多种计算机与操作系统平台的运行。英伟达方面表示,这些容器将帮助TensorFlow等深度学习框架更快更轻松地完成神经网络的设计与训练工作。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。