NVIDIA创始人兼首席执行官黄仁勋在7月3日举办的“地球虚拟引擎计划”柏林峰会(Berlin Summit for the Earth Virtualization Engines)主题演讲中表示,AI和加速计算将帮助气候研究人员创造“奇迹”,进而推动气候研究取得突破性进展。
“理查德·费曼曾说过,‘我不能创造我不理解的事物’,这就是为什么气候建模如此重要。” 黄仁勋在柏林的Harnack House对在场的180名与会者谈到。Harnack House是该地区科学和研究界的一个著名聚集地。
“所以,你们的工作对政策制定者、研究者和行业来说至关重要。”
为了推动这项工作,来自全球各地的与会者齐聚本届柏林峰会,探讨如何利用AI和高性能计算进行气候预测。
在演讲中,黄仁勋概述了气候研究人员要实现他们的目标而必须发生的三个重要突破,并提到了NVIDIA自身是如何通过其Earth-2与气候研究者和政策制定者开展合作,共同推动气候研究所做的努力。
第一个是以足够快的速度和足够高的分辨率,实现公里级的气候模拟。
第二个是对海量数据进行预计算的能力。
第三个是利用NVIDIA Omniverse将所有这些数据的交互可视化,使其能够为决策者、企业、公司和研究者所用。
新一轮气候和天气创新
“地球虚拟引擎”计划(简称EVE)是一项国际合作,汇集了专注于气候科学、高性能计算和AI的数字基础设施,旨在开创性地提供易于获取的公里级气候信息,以推进地球的可持续发展。
黄仁勋说:“Earth-2和EVE计划之所以能在完美的时间邂逅,是因为Earth-2是基于三个根本性的突破。”
这一计划有望加速发展进程,致力于实现2.5公里分辨率的协同气候预测。虽然挑战艰巨,但过去25年内所取得的巨大进步为其奠定了坚实的基础。
包括ICON、IFS、NEMO、MPAS、WRF-G在内的众多应用程序套件已经受益于加速计算,而且未来还会有更多的算力用于此类应用。
NVIDIA GH200 Grace Hopper超级芯片是一款突破性的加速的CPU,专为巨型AI和HPC应用而设计。对于运行TB级数据的应用,它能够提供高达10倍的性能。
它在设计时就考虑到了扩展,通过将大量芯片连接在一起,NVIDIA可以提供高能效系统,以便加快推进气候研究的前沿工作。黄仁勋表示:"对软件来说,它看起来就像一个巨大的处理器。”
为了帮助研究人员快速将大量数据用于工作,以更好地理解气候问题,黄仁勋提到了 NVIDIA Modulus 和 FourCastNet。前者是一个用于构建、训练和微调基于物理的机器学习模型开源框架,后者是一个数据驱动的全球天气预报模型,同时他还介绍了最新的AI驱动模型如何从真实世界中学习物理规律。
仅使用原始数据,FourCastNet就能够学习到复杂天气模式形成的原理。黄仁勋展示了FourCastNet如何通过模拟风暴中地球自转产生的科氏力,来准确预测飓风哈维的路径。
当这些模型与传统模拟创建的常规“检查点”联系在一起时,就可以进行更精确、长期的预测。黄仁勋随后演示了运行于NVIDIA GPU上的FourCastNet的集合预报结果如何预测到一场前所未有的北非热浪。
通过在Modulus中运行FourCastNet,NVIDIA只用以前单个成员预报的十分之一的时间,就可以生成1000个集合成员的21天的天气轨迹,同时实现1000倍的能耗降低。
最后,NVIDIA技术有望帮助所有这些知识变得更容易获取,数字孪生能够为日益复杂的系统创建交互式模型——从亚马逊的仓库到5G信号在密集城市环境中的传播方式。
随后,黄仁勋展示了一个在云端的令人惊叹的、高分辨率的全球气候数据的交互式可视化,从全球视图放大到柏林的详细视图。黄仁勋说,这种方法可以用来预测柏林、东京和布宜诺斯艾利斯等不同地区的气候和天气。
地球:最后的疆域
为了帮助应对此类挑战,黄仁勋概述了NVIDIA如何构建更加强大的系统来训练AI模型、模拟物理问题和实现交互式可视化。
他表示:“这些新型超级计算机刚刚上线。这是你能够想象得到的最新计算技术。”
黄仁勋在演讲结束时感谢了该领域的主要研究人员并幽默地为EVE倡议了一项使命宣言。
“地球,最后的疆域,这是EVE的航程”。它的“使命是突破气候建模服务的计算极限,寻找新的方法和技术来研究大到全球范围内、小到地方区域的气候状况,让人们当下就能了解所采取的应对措施是否奏效,以及未来应如何调整,并勇敢地探索前人未曾涉足的疆域。”
不难发现,无效和无法预测的天气对人类社会造成了巨大损失。有数据显示,2022 年,无效和无法预测的天气就造成了约 7140 亿 美元的损失。
尽管目前全球利用AI进行绿色转型的总体方向是正确的,但算力不够、数据可视化不清晰等问题显著。Earth-2和EVE计划的时间邂逅,将进一步加快人工智能解决气候变化问题方面速度。
对企业而言,准确的天气模型对于企业正确预测可再生能源的生产和制定自然灾害预案至关重要。为了避免这种情况,企业需要更快、更精准的天气模型,而Earth-2是一个不错的选择。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。