本周,新一轮全球超算五百强榜单再度出炉。与上一轮一样,富士通Fugaku超级计算机以415.5千万亿次的高性能Linpack(HPL)基准测试结果高居榜首,击败了去年的冠军IBM Summit超级计算机。曾经的冠军此次下落一名,位列榜眼。虽然富士通、ARM与日本都对这一结果感到欣慰,但结合现实使用场景,五百强榜单到底有什么意义?
实际上,全球各顶级超级计算机的竞争以Linpack基准测试为核心。这套基准只是简单代替系统供应商向系统中添加计算元素,因此衡量的就只有纯粹的原始处理能力,其中不存在任何现实压力与变量。在过去25年以来,超算五百强榜单一直使用Linpack作为基准,相关结果也得到计算领域众多供应商的高度关注。但可以肯定的是,这样的测试基准已然过时。虽然基准测试能够激发各方对工作负载处理能力与蛮力计算水平的优化,但却始终体现不出能够解决现实问题的明智方法。
IBM Summit超级计算机
为了防止各机构及企业作弊,这项基准测试对计算优化方法做出了一系列非常严格的限制,且仅衡量科学计算中使用的双精度浮点(64位)数学运算(大部分计算机只针对32位数学运算进行优化)。实际上,Linpack性能数据只能表现设备实际性能中的一小部分。此外,五百强Linpack测试属于一种“简单粗暴”的峰值性能测量方法,甚至没有考虑到在当前以及未来很长一段时间内,超级计算机需要针对人工智能(AI)类工作负载进行性能优化的现实需求。事实上,就连发布五百强结果的组织自己,都在着手推广融入了AI处理元素的HPCG与HPL-AI等新型基准测试。
为了处理超级计算机生成的庞大数据,并更好地对模拟执行进行优化,机器学习与AI优化将在未来的大型数据集处理领域占据愈发重要的地位。在意识到这些局限性之后,以IBM为代表的不少系统供应商开始将目光投向五百强浮点运算之外,致力于解决现实世界(以及由客户提出)的高性能计算问题。
下一阶段的核心,在于以更具创意的方式优化数据与超算性能。业界应该寻找高效利用现有系统的方法。对高性能计算中心进行硬件升级往往会带来极为高昂的成本,因此提高效率并优化现有数据中心策略才是成本更低、浪费空间更小但收益潜力巨大的正确发展方向。
目前的智能化计算示例之一,正是IBM公布的贝叶斯优化技术。通过将这项优化技术与数据集参数对接起来,IBM方面得以大大缩短各轮模拟运行之间的计算周期,且不会对模型精度造成任何影响。该软件大大减少了计算机工作量,能够以低一个数量级的计算周期水平产生相同的结果。
IBM公司在自家内部Power处理器设计中一直在使用贝叶斯优化技术。例如,对于硅芯片设计流程中的单一环节,IBM发现贝叶斯优化能够将模拟工作量减少达79%(由135步减少至28步),同时提供相同甚至更好的结果。贝叶斯优化技术在药物发现测试中也带来良好表现,能够将候选药物的定位速度较传统搜索技术提升达40倍。另外,这项技术可以针对本地、云端或者混合云系统进行配置,且广泛兼容各类语言与平台。
目前,五百强超算排名也没能充分考虑到分布式潮流与计算能力边缘化的重大历史趋势。边缘计算允许我们立足更接近信息源的位置以数据进行预处理。五百强排名仍专注于利用设备整体解决单一问题,而分布式计算与边缘计算则采取完全不同的问题解决办法,因此必然需要一套完全不同的性能衡量指标。
政府资助的研究机构将继续为全球超算五百强中的排名而努力,但商业客户更需要务实须高效的解决方案。作为一家致力于为客户交付实际成果的厂商,IBM正积极推动高性能计算领域的又一轮创新。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。