虽然摩尔定律已经终结,但提升计算性能的需求却永无止境。为此,采用传统方法的成本与功耗也将成倍增加。
与此同时,为减缓气候变化所带来的影响,我们需要更加高效的数据中心。全球数据中心每年的能耗已经超过200兆瓦时,占全球总能耗的2%。
最新发布的Green500榜单展现了加速计算的能效。上榜的均是全球最高效的超级计算机,其中排名前30的系统都采用了加速计算。加速计算在能效方面的影响是非常惊人的。

据NVIDIA估计TOP500榜单上的系统每年需要消耗超过5太瓦时或价值7.5亿美元的能源。
但如果TOP500榜单上的系统都能够像Green500榜单上排名前30的系统那样高效,那么这一数字就能削减80%以上,即只需消耗1.5亿美元的能源,足足节省4太瓦时。
反之,以如今TOP500系统的电力预算,如果这些超级计算机都能达到Green500榜单中排名前30的系统的效率,则能够提供5倍于如今的性能。
而最新Green500系统所突显的效率提升还只是冰山一角。NVIDIA正在不断改进其CPU、GPU、软件和系统组合的能耗。
Hopper在Green500榜单上的首次亮相
在最新Green500榜单上排名前30的系统中,有23个采用了NVIDIA的技术。
其中最引人注目的是,纽约市Flatiron研究所的风冷式ThinkSystem位列Green500榜首,它由联想公司制造,搭载了NVIDIA Hopper H100 GPU。
这台超级计算机,又名Henri。根据Green500的数据,Henri每瓦可进行650亿次双精度浮点运算,将被用于解决计算天体物理学、生物学、数学、神经科学和量子物理学领域的问题。
TOP500新上榜单的系统中,速度最快的新计算机是非营利性联盟Cineca管理的Leonardo。该系统采用了近14,000个NVIDIA A100 GPU,在TOP500榜单中位列第4,同时在Green500榜单中也排在第13位。
在TOP500榜单上,共有361个系统采用了NVIDIA技术,而90%的新系统都采用了NVIDIA技术(参见图表)。

最新TOP500榜单上使用NVIDIA技术的系统数量达到历史新高。
新一代加速数据中心
NVIDIA还在开发能够为加速数据中心提供更高能效与性能的新计算架构。
今年早些时候发布的Grace CPU和Grace Hopper超级芯片将进一步大幅提升NVIDIA加速计算平台的能效。凭借Grace CPU和低功耗LPDDR5X内存的惊人效率,Grace CPU超级芯片的每瓦性能最高可达到传统CPU的两倍。
假设一座100万瓦的高性能计算数据中心将20%的电力分配给CPU分区,将80%的电力分配给使用Grace和Grace Hopper的加速分区,则与基于x86、采用类似分区方法的数据中心相比,该数据中心可以在相同的电力预算下完成1.8倍的工作。
DPU进一步提升效率
除了Grace和Grace Hopper,NVIDIA网络技术也大大加快了云原生超级计算的速度。同时,仿真使用量的增加也推动了对超级计算服务的需求。
包含了 NVIDIA BlueField-3 DPU的NVIDIA Quantum-2 InfiniBand平台提供了云计算服务提供商和超级计算中心所需的极高性能、广泛的可用性与强大的安全性。
最近的一份白皮书对此进行了描述,展示了如何使用DPU来卸载和加速网络、安全、存储或其他基础设施功能以及控制平面应用,从而将服务器功耗降低30%。
节省的电量与服务器负载量成正比。一座拥有1万台服务器的大型数据中心在三年的服务器寿命期内,可以轻松节省500万美元的电费,另外还可以节省冷却、输电、机架空间和服务器投资方面的成本。
加速计算结合DPU在网络、安全和存储方面的能力,已成为未来提升数据中心能效的重要一步。
事半功倍
科学研究的方法在迅速转变,通过基于数据分析、人工智能和物理学仿真等方式的驱动,更高效的计算机将能够成为下一代科学突破的关键。
NVIDIA正致力于为研究者提供针对这种全新科学研究方法进行优化的多学科高性能计算平台,同时兼顾性能与效率,助力科学家能够藉此开展造福全人类的重大研究。
好文章,需要你的鼓励
尽管全球企业AI投资在2024年达到2523亿美元,但MIT研究显示95%的企业仍未从生成式AI投资中获得回报。专家预测2026年将成为转折点,企业将从试点阶段转向实际部署。关键在于CEO精准识别高影响领域,推进AI代理技术应用,并加强员工AI能力培训。Forrester预测30%大型企业将实施强制AI培训,而Gartner预计到2028年15%日常工作决策将由AI自主完成。
这项由北京大学等机构联合完成的研究,开发了名为GraphLocator的智能软件问题诊断系统,通过构建代码依赖图和因果问题图,能够像医生诊断疾病一样精确定位软件问题的根源。在三个大型数据集的测试中,该系统比现有方法平均提高了19.49%的召回率和11.89%的精确率,特别在处理复杂的跨模块问题时表现优异,为软件维护效率的提升开辟了新路径。
2026年软件行业将迎来定价模式的根本性变革,从传统按席位收费转向基于结果的付费模式。AI正在重塑整个软件经济学,企业IT预算的12-15%已投入AI领域。这一转变要求建立明确的成功衡量指标,如Zendesk以"自动化解决方案"为标准。未来将出现更精简的工程团队,80%的工程师需要为AI驱动的角色提升技能,同时需要重新设计软件开发和部署流程以适应AI优先的工作流程。
这项由德国达姆施塔特工业大学领导的国际研究团队首次发现,当前最先进的专家混合模型AI系统存在严重安全漏洞。通过开发GateBreaker攻击框架,研究人员证明仅需关闭约3%的特定神经元,就能让AI的攻击成功率从7.4%暴增至64.9%。该研究揭示了专家混合模型安全机制过度集中的根本缺陷,为AI安全领域敲响了警钟。