达拉斯 - SC22 - 2022年11月14日 - NVIDIA今日宣布 Quantum-2 InfiniBand 已得到广泛采用,包括微软Azure云在内的多个客户已使用新产品用于加速科学研究。
NVIDIA 合作伙伴在 SC22 上介绍了这些新产品。NVIDIA 还在会上发布了 cuQuantum、CUDA® 和 BlueField® DOCA™ 加速库的重大更新。
Quantum-2 和库的更新均属于 NVIDIA HPC 平台的一部分。NVIDIA HPC 平台作为完整的技术堆栈,包含 CPU、GPU、DPU、系统、网络以及各种 AI 和 HPC 软件,让研究者能够基于本地和云端的强大系统,大幅加速工作进程。
NVIDIA 创始人兼首席执行官黄仁勋表示: “AI 正在重塑科学研究的方法。通过对数据进行学习,AI 能够预测自然界高度复杂的运转机制——从核聚变反应堆中等离子体粒子的行为,到未来几十年人类对区域气候的影响等。我们为科学家提供了一个能够加速原理性数值与 AI 方法的通用科学计算平台,这一工具将助力科学家开展能够造福人类的研究。”
Azure 率先提供用于 HPC 工作负载的 NVIDIA Quantum-2
在 NVIDIA 于今年 3 月举办的 GTC 上宣布 Quantum-2 全面可用后,微软 Azure 就率先采用了NVIDIA Quantum-2 InfiniBand网络平台。
微软 Azure AI 基础设施总经理 Nidhi Chappell 表示:“微软 Azure 等新一代云平台孕育着 AI 和 HPC 等革命性企业级技术的未来,使创新者有望实现划时代的技术突破。NVIDIA Quantum-2 InfiniBand 网络平台使 Azure 具备了世界级算力中心的强大吞吐能力,且能够以云规模按需提供,助力使用 Azure 的研究者和科学家成就毕生的事业。”
加速库迎来重大更新
为助力推动科学研究,NVIDIA 发布了 CUDA、cuQuantum 和 DOCA 加速库的重大更新:
● NVIDIA CUDA 库现包括一个多节点、多 GPU 的 Eigensolver,能够为领先的 HPC 应用提供前所未有的规模和性能,例如用于第一性原理量子力学计算的软件包 VASP。
● 用于加速量子计算工作流的 NVIDIA cuQuantum 软件开发套件现支持近似张量网络的方法。这使研究者能够模拟数万个量子位,并对使用 cuQuantum Appliance 的超高性能量子模拟,自动实现多节点、多 GPU 支持。
● 用于 NVIDIA BlueField DPU 的开放式云 SDK 和加速框架——NVIDIA DOCA 现包括支持新存储用例的高级可编程性、安全性和功能。
通过这些库,研究者能够在多台服务器上进行扩展,并实现大规模的性能提升,从而推动科学研究。NVIDIA HPC 加速库已在领先的云平台 AWS、微软 Azure 和 Oracle Cloud Infrastructure 上使用。
好文章,需要你的鼓励
全球数据中心建设需求持续高涨。北美方面,美国数据中心建设支出年化达510亿美元,微软在威斯康星州开放33亿美元设施,亚马逊和谷歌宣布在密苏里州合计投资250亿美元。欧洲方面,SoftBank将在法国建设5GW AI数据中心,投资额达750亿欧元。亚太地区,AirTrunk计划在印度投资210亿美元建设3GW数据中心。中东与非洲地区也有多项大规模项目落地。
这项研究提出Epi2Diff方法,通过将大型推理模型的解题思考过程拆解为认知片段序列,提取过程特征预测考题对人类的难度,在四个真实考试数据集上超越了所有对比基线。
随着企业将AI融入机器人、工业设备等物理基础设施,边云协同架构正成为关键课题。以Luminous Robotics和先正达为例:前者在太阳能农场部署的机器人每秒做出10次决策,数据定期上传云端持续优化模型;后者通过Cropwise平台整合卫星、无人机、拖拉机传感器数据,辅助农民完成约150项农业决策。两家公司均强调,边缘端负责实时响应,云端负责模型训练与更新,同时保持人工监督以确保安全与准确性。
南京大学与阿里巴巴提出MIMFlow,将掩码图像建模与标准化流端到端融合,让生成模型专注语义建模,以更少参数和更少令牌在ImageNet上取得FID 2.50的优异表现。