全球最快的超级计算机中有近70%使用NVIDIA技术,并且它们正在越来越多地使用AI帮助研究人员加快科学研究速度。
全球最快的超级计算机不但变得比以前更快,而且还变得更加智能,从而为更多的工作负载提供支持。
在SC20大会今天发布的全球最快超级计算机TOP500榜单中,近70%的机器(包括排在前10名中的8台)均采用了NVIDIA技术。
此外,最负盛名的超级计算机奖项——戈登·贝尔奖(Gordon Bell Prize)的四位候选人(于本周在SC20上被提名)均使用AI推动他们的科学研究。
他们的共同点在于:均使用NVIDIA的端到端HGX AI超级计算平台为科学计算、数据分析和AI工作负载提速。这是一个始于高性能芯片和超高速智能网络,而最终有关用于大型科学研究的全球数据中心级平台的故事。
将AI加入到HPC中,并扩展至传统超级计算中心之外的平台中是这一领域的重大变革。自Seymour Cray的CDC 6600于1964年发布以来,该领域一直专注于运用体积更大、性能更强的计算机进行计算密集型模拟与建模。
最新TOP500榜单超越了高性能Linpack的结果:
速度记录:如果以传统超级计算性能基准(即以被称为FP64的双精度浮点格式进行运算的速度)衡量,NVIDIA技术为全球最快的集群提速,令榜单排名前十中的八台机器如虎添翼,这其中包括了排名第五的NVIDIA Selene超级计算机(全球性能最强大的商业系统)、排名第七的JUWELS(Forschungszentrum Jülich)与排名第十的Dammam-7(Saudi Aramco)等新上榜的机器。
“智能”记录:如果以作为AI性能基准的混合精度标准——HPL-AI进行衡量,采用NVIDIA技术的机器在榜单上均排名靠前,比如美国橡树岭国家实验室(Oak Ridge National Lab)的Summit超级计算机(0.55百亿亿次级)和NVIDIA Selene(0.25百亿亿次级)。
环保记录:NVIDIA DGX SuperPOD系统在Green500最高效超级计算机榜单上排名第一,以每瓦26.2gigaflops创造了新的功效世界纪录。该榜单前30名计算机中有25台使用了NVIDIA技术。
AI超级计算开启飞速发展黄金时代
此次大会,最令人印象深刻的成就也许就是我们已经提前实现了超越百亿亿次计算的目标。
意大利CINECA超级计算中心在10月发布了建造全球最强大的AI超级计算机——Leonardo的计划,性能有望达到10 百亿亿次级。捷克、卢森堡和斯洛文尼亚也发布了多台全新EuropHPC AI系统。除了欧洲之外,亚洲和北美也将建造更多AI超级计算机。
这是因为现代AI运用NVIDIA GPU、NVIDIA CUDA-X库和NVIDIA Mellanox InfiniBand(全球唯一的全加速网络内计算平台)惊人的并行处理能力,将大量数据输入高级神经网络,从而创建出精密复杂的现实世界模型,使科学家们能够完成通过其他方式无法完成的宏伟项目。
相比往年戈登·贝尔奖候选者所模拟的最大系统,今年该奖的候选者之一 —— 劳伦斯·伯克利国家实验室(Lawrence Berkeley National Laboratory)计算研究部门的团队运用AI将分子动力学模拟的规模至少扩大了100倍。
一切都是为了推动科学发展
毫无疑问,系统速度的确重要,但更重要的是在现实世界中如何使用系统。
因此,你会看到新型AI超级计算机正在被推到对抗新冠疫情的最前线。
今年戈登·贝尔奖四位候选者中有三位专注于使用NVIDIA AI抗击COVID-19疫情。
其中一个团队在劳伦斯·利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的Sierra超级计算机(TOP500榜单排名第三)上训练了一个AI,该AI能够在23分钟内从16亿种复方中筛选出新的候选药物。
另一个团队借助橡树岭国家实验室的Summit超级计算机(TOP500榜单排名第二)上的27612个NVIDIA GPU,每秒在两种关键的SARS-CoV-2蛋白结构上测试19028种候选药物成分。
还有一个团队使用Summit创建AI工作流来建立SARS-CoV-2刺突蛋白(主要的病毒感染机制)如何攻击人类ACE2受体的模型。
凭借可扩展的NVIDIA HGX AI超级计算平台(包括从处理器到网络和软件等所有部分)日益普及,科学家们可以在云计算公司的超大规模数据中心,以及超级计算机中运行他们的工作负载。
这个统一平台融合了HPC、数据分析和AI工作负载。目前该平台上有230万开发者并支持超过1800个加速应用、所有AI框架以及包括DASK和Spark在内的主流数据分析框架,使科学家和研究人员能够在内置GPU的x86、Arm和Power系统上立即提高生产力。
此外,NVIDIA NGC产品目录为最新版本的HPC和AI应用提供性能经过优化的容器,使科学家和研究人员可以快速完成部署,并把精力集中在推动科学发展上。
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。