达拉斯 - SC22 - 2022年11月14日 - NVIDIA今日宣布 Quantum-2 InfiniBand 已得到广泛采用,包括微软Azure云在内的多个客户已使用新产品用于加速科学研究。
NVIDIA 合作伙伴在 SC22 上介绍了这些新产品。NVIDIA 还在会上发布了 cuQuantum、CUDA® 和 BlueField® DOCA™ 加速库的重大更新。
Quantum-2 和库的更新均属于 NVIDIA HPC 平台的一部分。NVIDIA HPC 平台作为完整的技术堆栈,包含 CPU、GPU、DPU、系统、网络以及各种 AI 和 HPC 软件,让研究者能够基于本地和云端的强大系统,大幅加速工作进程。
NVIDIA 创始人兼首席执行官黄仁勋表示: “AI 正在重塑科学研究的方法。通过对数据进行学习,AI 能够预测自然界高度复杂的运转机制——从核聚变反应堆中等离子体粒子的行为,到未来几十年人类对区域气候的影响等。我们为科学家提供了一个能够加速原理性数值与 AI 方法的通用科学计算平台,这一工具将助力科学家开展能够造福人类的研究。”
Azure 率先提供用于 HPC 工作负载的 NVIDIA Quantum-2
在 NVIDIA 于今年 3 月举办的 GTC 上宣布 Quantum-2 全面可用后,微软 Azure 就率先采用了NVIDIA Quantum-2 InfiniBand网络平台。
微软 Azure AI 基础设施总经理 Nidhi Chappell 表示:“微软 Azure 等新一代云平台孕育着 AI 和 HPC 等革命性企业级技术的未来,使创新者有望实现划时代的技术突破。NVIDIA Quantum-2 InfiniBand 网络平台使 Azure 具备了世界级算力中心的强大吞吐能力,且能够以云规模按需提供,助力使用 Azure 的研究者和科学家成就毕生的事业。”
加速库迎来重大更新
为助力推动科学研究,NVIDIA 发布了 CUDA、cuQuantum 和 DOCA 加速库的重大更新:
● NVIDIA CUDA 库现包括一个多节点、多 GPU 的 Eigensolver,能够为领先的 HPC 应用提供前所未有的规模和性能,例如用于第一性原理量子力学计算的软件包 VASP。
● 用于加速量子计算工作流的 NVIDIA cuQuantum 软件开发套件现支持近似张量网络的方法。这使研究者能够模拟数万个量子位,并对使用 cuQuantum Appliance 的超高性能量子模拟,自动实现多节点、多 GPU 支持。
● 用于 NVIDIA BlueField DPU 的开放式云 SDK 和加速框架——NVIDIA DOCA 现包括支持新存储用例的高级可编程性、安全性和功能。
通过这些库,研究者能够在多台服务器上进行扩展,并实现大规模的性能提升,从而推动科学研究。NVIDIA HPC 加速库已在领先的云平台 AWS、微软 Azure 和 Oracle Cloud Infrastructure 上使用。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。