英国剑桥大学和NVIDIA DGX SuperPOD指明通往新一代安全、高效的高性能计算(HPC)云之路。
云原生超级计算是超级计算领域的下一个大趋势。如今趋势已至,旨在助力我们应对最棘手的HPC和AI应用。
加利福尼亚州圣克拉拉市 – 2021年4月14日 – 据 NVIDIA消息,在英国,剑桥大学正在构建一台云原生超级计算机。在美国,有两个研究团队正在分别开发云原生超级计算的关键软件部分。
作为与统一通信框架(UCF)联盟合作项目的一部分,洛斯阿拉莫斯国家实验室正在助力实现加速数据算法的能力。俄亥俄州立大学正在更新消息传递接口(MPI)软件,以增强科学仿真。
NVIDIA 正在通过最新的DGX SuperPOD向全球用户提供云原生超级计算机。DGX SuperPOD现已投入生产,它包含NVIDIA BlueField-2 DPU(数据处理器)等关键组成部分。
那么,何为云原生超级计算?
就像锐滋的花生酱夹心巧克力一样,云原生超级计算融合了两项业界领先的技术优点。
云原生超级计算机融合了高性能计算的强大算力和云服务的安全性与易用性。
换个角度看,云原生超级计算提供了一个性能强如TOP500超级计算机的HPC云,它在保障不牺牲应用性能的同时允许多用户安全共享。
BlueField DPU通过支持安全、通信和管理任务的卸载来创建高效的云原生超级计算机。
云原生超级计算机有何功能?
云原生超级计算机有两个关键功能。
首先,它允许多用户共享一台超级计算机,同时保证每个用户的应用的安全性和私密性。这种能力被称为“多租户隔离”,在当今的商业云计算服务中十分普遍,但一般不会出现在技术和科学应用的HPC系统中,因为在这些系统中,裸性能的优先级最高,而安全服务会降低系统效率。
其次,云原生超级计算机使用DPU来处理存储、租户隔离安全和系统管理等任务。这样可以卸载CPU,使其专注于处理任务,从而最大限度地提高系统的整体性能。
如此,一台超级计算机便可以在不损失性能的情况下,实现云原生服务。未来DPU将处理更多的卸载任务,从而使系统在运行HPC和AI应用时时刻保持最高的运行效率。
云原生超级计算机如何运行?
如今,超级计算机通常有两个“大脑”——CPU和加速器(一般为GPU)。
加速器集合了数千个处理核,可为AI和HPC应用中最重要的并行运算提供加速。CPU是针对需要快速串行处理的算法部分而设计的,但随着其管理的系统日益庞大且日渐复杂,通信的层数不断增多,导致CPU的负担越来越重。
云原生超级计算机引入第三个“大脑”——DPU,旨在帮助构建更快、更高效的系统。DPU能够卸载安全、通信、存储等需要由现代系统管理的工作。
超级计算机的专用通道
在传统超级计算机中,运行中的计算任务有时不得不暂停等待CPU去处理通信任务,这是业界熟知的一个问题,被称为系统噪声。
在云原生超级计算机中,计算和通信是并行处理的。这就像在高速公路上开设第三条车道一样,能够让所有流量变得更加顺畅。
俄亥俄州立大学MVAPICH实验室是HPC通信领域的专业机构。该实验室的早期测试显示,在云原生超级计算机执行某些HPC作业的速度是传统计算机的1.4倍。该实验室还展示,云原生超级计算机实现了计算和通信功能的100%重合,这比现有的HPC系统高出99%。
云原生超级计算之专家视角
这就是全球各地陆续推出云原生超级计算的原因。
剑桥大学高性能计算总监Paul Calleja表示:“我们正在打造欧洲首台科研云原生超级计算机,以提供裸金属性能与云原生InfiniBand服务。”
“按照2020年11月TOP500榜单,这套系统将跻身前100名。它将使我们的研究人员能够运用超级计算架构领域的最新成果来充分优化他们的应用。”
HPC专家正在为云原生超级计算机的进一步发展铺路。
统一通信框架联盟总监Steve Poole表示:“由工业界和学术界领先成员组成的UCF联盟正在创建实现未来云原生超级计算所需的生产级通信框架和开放标准。”该联盟成员包括来自Arm、IBM、NVIDIA、美国国家实验室和多所美国大学的代表。
俄亥俄州立大学计算机科学与工程系教授兼网络计算实验室主任Dhabaleswar K.(DK)Panda表示:“我们的测试表明,云原生超级计算机的架构效率能够将超级计算机的HPC性能提升至新的高度,并实现新的安全功能。”
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。