全球最快的超级计算机中有近70%使用NVIDIA技术,并且它们正在越来越多地使用AI帮助研究人员加快科学研究速度。
全球最快的超级计算机不但变得比以前更快,而且还变得更加智能,从而为更多的工作负载提供支持。
在SC20大会今天发布的全球最快超级计算机TOP500榜单中,近70%的机器(包括排在前10名中的8台)均采用了NVIDIA技术。
此外,最负盛名的超级计算机奖项——戈登·贝尔奖(Gordon Bell Prize)的四位候选人(于本周在SC20上被提名)均使用AI推动他们的科学研究。
他们的共同点在于:均使用NVIDIA的端到端HGX AI超级计算平台为科学计算、数据分析和AI工作负载提速。这是一个始于高性能芯片和超高速智能网络,而最终有关用于大型科学研究的全球数据中心级平台的故事。
将AI加入到HPC中,并扩展至传统超级计算中心之外的平台中是这一领域的重大变革。自Seymour Cray的CDC 6600于1964年发布以来,该领域一直专注于运用体积更大、性能更强的计算机进行计算密集型模拟与建模。
最新TOP500榜单超越了高性能Linpack的结果:
速度记录:如果以传统超级计算性能基准(即以被称为FP64的双精度浮点格式进行运算的速度)衡量,NVIDIA技术为全球最快的集群提速,令榜单排名前十中的八台机器如虎添翼,这其中包括了排名第五的NVIDIA Selene超级计算机(全球性能最强大的商业系统)、排名第七的JUWELS(Forschungszentrum Jülich)与排名第十的Dammam-7(Saudi Aramco)等新上榜的机器。
“智能”记录:如果以作为AI性能基准的混合精度标准——HPL-AI进行衡量,采用NVIDIA技术的机器在榜单上均排名靠前,比如美国橡树岭国家实验室(Oak Ridge National Lab)的Summit超级计算机(0.55百亿亿次级)和NVIDIA Selene(0.25百亿亿次级)。
环保记录:NVIDIA DGX SuperPOD系统在Green500最高效超级计算机榜单上排名第一,以每瓦26.2gigaflops创造了新的功效世界纪录。该榜单前30名计算机中有25台使用了NVIDIA技术。
AI超级计算开启飞速发展黄金时代
此次大会,最令人印象深刻的成就也许就是我们已经提前实现了超越百亿亿次计算的目标。
意大利CINECA超级计算中心在10月发布了建造全球最强大的AI超级计算机——Leonardo的计划,性能有望达到10 百亿亿次级。捷克、卢森堡和斯洛文尼亚也发布了多台全新EuropHPC AI系统。除了欧洲之外,亚洲和北美也将建造更多AI超级计算机。
这是因为现代AI运用NVIDIA GPU、NVIDIA CUDA-X库和NVIDIA Mellanox InfiniBand(全球唯一的全加速网络内计算平台)惊人的并行处理能力,将大量数据输入高级神经网络,从而创建出精密复杂的现实世界模型,使科学家们能够完成通过其他方式无法完成的宏伟项目。
相比往年戈登·贝尔奖候选者所模拟的最大系统,今年该奖的候选者之一 —— 劳伦斯·伯克利国家实验室(Lawrence Berkeley National Laboratory)计算研究部门的团队运用AI将分子动力学模拟的规模至少扩大了100倍。
一切都是为了推动科学发展
毫无疑问,系统速度的确重要,但更重要的是在现实世界中如何使用系统。
因此,你会看到新型AI超级计算机正在被推到对抗新冠疫情的最前线。
今年戈登·贝尔奖四位候选者中有三位专注于使用NVIDIA AI抗击COVID-19疫情。
其中一个团队在劳伦斯·利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的Sierra超级计算机(TOP500榜单排名第三)上训练了一个AI,该AI能够在23分钟内从16亿种复方中筛选出新的候选药物。
另一个团队借助橡树岭国家实验室的Summit超级计算机(TOP500榜单排名第二)上的27612个NVIDIA GPU,每秒在两种关键的SARS-CoV-2蛋白结构上测试19028种候选药物成分。
还有一个团队使用Summit创建AI工作流来建立SARS-CoV-2刺突蛋白(主要的病毒感染机制)如何攻击人类ACE2受体的模型。
凭借可扩展的NVIDIA HGX AI超级计算平台(包括从处理器到网络和软件等所有部分)日益普及,科学家们可以在云计算公司的超大规模数据中心,以及超级计算机中运行他们的工作负载。
这个统一平台融合了HPC、数据分析和AI工作负载。目前该平台上有230万开发者并支持超过1800个加速应用、所有AI框架以及包括DASK和Spark在内的主流数据分析框架,使科学家和研究人员能够在内置GPU的x86、Arm和Power系统上立即提高生产力。
此外,NVIDIA NGC产品目录为最新版本的HPC和AI应用提供性能经过优化的容器,使科学家和研究人员可以快速完成部署,并把精力集中在推动科学发展上。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。