与Arm、Ampere、Cray、富士通、HPE、Marvell携手构建GPU加速服务器,以满足从超大规模云到边缘、从模拟到AI、从高性能存储到百万兆级超级计算等多样化需求
NVIDIA于今日发布一款参考设计平台,使企业能够快速构建GPU加速的Arm服务器,以满足日益多样化的科学和工业应用需求。这开辟了高性能计算的新纪元。
NVIDIA创始人兼首席执行官黄仁勋在2019国际超级计算大会(SC19)上宣布推出这款参考设计平台。该平台由硬件和软件基础模块组成,能够满足高性能计算(HPC)社区对于类型更加多样化的CPU架构日益增长的需求。通过该平台,超级计算中心、超大型云运营商和企业能够将NVIDIA加速计算平台的优势与最新的Arm服务器平台相结合。
为了构建这一参考平台,NVIDIA与Arm及其生态合作伙伴(包括Ampere、富士通和Marvell)联手,以确保NVIDIA GPU与Arm处理器之间的无缝协作。该参考平台还得益于与HPE旗下公司Cray和HPE这两家早期采用Arm服务器的供应商之间的紧密合作。此外,许多高性能计算软件公司已使用NVIDIA CUDA-X库来构建可在Arm服务器上运行、并可通过GPU实现的管理和监控工具。
黄仁勋表示:“高性能计算正在崛起。机器学习和AI领域的突破正在重新定义科学研究方法,并且可能带来激动人心的新架构。从超大规模云到百万兆级超级计算,NVIDIA GPU与ARM的组合让创新者们能够为不断增加的新应用创建系统。”
Arm IP产品部门总裁Rene Haas表示:“ Arm正在与生态合作伙伴一同努力,为百万兆级的Arm系统级芯片提供前所未有的性能和效率。我们与NVIDIA合作,将CUDA加速带入到Arm架构当中,这对于高性能计算社区来说,具有里程碑式的意义。为了应对全球最复杂的研究,挑战并推动嵌入式系统、汽车和边缘细分市场的进一步发展,高性能计算社区已经在部署Arm技术。”
今年早些时候,NVIDIA宣布为Arm带来CUDA-X软件平台。NVIDIA此次发布这一参考平台正是对此前承诺的兑现。根据这一承诺,NVIDIA正在提供其Arm兼容软件开发套件的预览版本。该版本包含NVIDIA CUDA-X库和加速计算开发工具。
除了使自己的软件兼容Arm之外,NVIDIA还与 GROMACS、LAMMPS、MILC、NAMD、Quantum Espresso和Relion等领先的高性能计算应用开发商密切合作,为ARM提供GPU加速的应程序用。为了让Arm平台上的应用实现GPU加速,NVIDIA及其高性能计算应用生态合作伙伴编译了大量代码。
为了构建Arm生态,NVIDIA与领先的Linux发行商Canonical、Red Hat、SUSE,以及业内领先的高性能计算基础工具供应商展开合作。
几家世界级的超级计算中心已开始测试GPU加速Arm计算系统,其中包括美国的橡树岭国家实验室和桑迪亚国家实验室、英国布里斯托大学以及日本理化学研究所。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。