与Arm、Ampere、Cray、富士通、HPE、Marvell携手构建GPU加速服务器,以满足从超大规模云到边缘、从模拟到AI、从高性能存储到百万兆级超级计算等多样化需求
NVIDIA于今日发布一款参考设计平台,使企业能够快速构建GPU加速的Arm服务器,以满足日益多样化的科学和工业应用需求。这开辟了高性能计算的新纪元。
NVIDIA创始人兼首席执行官黄仁勋在2019国际超级计算大会(SC19)上宣布推出这款参考设计平台。该平台由硬件和软件基础模块组成,能够满足高性能计算(HPC)社区对于类型更加多样化的CPU架构日益增长的需求。通过该平台,超级计算中心、超大型云运营商和企业能够将NVIDIA加速计算平台的优势与最新的Arm服务器平台相结合。
为了构建这一参考平台,NVIDIA与Arm及其生态合作伙伴(包括Ampere、富士通和Marvell)联手,以确保NVIDIA GPU与Arm处理器之间的无缝协作。该参考平台还得益于与HPE旗下公司Cray和HPE这两家早期采用Arm服务器的供应商之间的紧密合作。此外,许多高性能计算软件公司已使用NVIDIA CUDA-X库来构建可在Arm服务器上运行、并可通过GPU实现的管理和监控工具。
黄仁勋表示:“高性能计算正在崛起。机器学习和AI领域的突破正在重新定义科学研究方法,并且可能带来激动人心的新架构。从超大规模云到百万兆级超级计算,NVIDIA GPU与ARM的组合让创新者们能够为不断增加的新应用创建系统。”
Arm IP产品部门总裁Rene Haas表示:“ Arm正在与生态合作伙伴一同努力,为百万兆级的Arm系统级芯片提供前所未有的性能和效率。我们与NVIDIA合作,将CUDA加速带入到Arm架构当中,这对于高性能计算社区来说,具有里程碑式的意义。为了应对全球最复杂的研究,挑战并推动嵌入式系统、汽车和边缘细分市场的进一步发展,高性能计算社区已经在部署Arm技术。”
今年早些时候,NVIDIA宣布为Arm带来CUDA-X软件平台。NVIDIA此次发布这一参考平台正是对此前承诺的兑现。根据这一承诺,NVIDIA正在提供其Arm兼容软件开发套件的预览版本。该版本包含NVIDIA CUDA-X库和加速计算开发工具。
除了使自己的软件兼容Arm之外,NVIDIA还与 GROMACS、LAMMPS、MILC、NAMD、Quantum Espresso和Relion等领先的高性能计算应用开发商密切合作,为ARM提供GPU加速的应程序用。为了让Arm平台上的应用实现GPU加速,NVIDIA及其高性能计算应用生态合作伙伴编译了大量代码。
为了构建Arm生态,NVIDIA与领先的Linux发行商Canonical、Red Hat、SUSE,以及业内领先的高性能计算基础工具供应商展开合作。
几家世界级的超级计算中心已开始测试GPU加速Arm计算系统,其中包括美国的橡树岭国家实验室和桑迪亚国家实验室、英国布里斯托大学以及日本理化学研究所。
好文章,需要你的鼓励
购买笔记本电脑时,用户现在需要了解Copilot+ PC、NPU和本地AI处理等新概念。搭载专用神经处理单元(NPU)的Copilot+ PC能提供至少40 TOPS的AI算力,支持实时字幕翻译、视频通话优化、AI图像编辑等功能,同时提升续航表现。戴尔最新产品线涵盖多种选择:Dell 14 Plus适合学生和通勤族,Dell 16 Plus适合多任务办公用户,XPS 14面向轻度创作者,XPS 16则以31小时超长续航和3.6磅轻薄机身成为内容创作者的旗舰之选。
香港科技大学与华为联合提出LISA训练方法,通过让副网络对齐"似然分数",将ControlNet等图像生成模型的训练收敛速度提升逾2.78倍,同时改善图像质量与条件控制精度。
圣安德鲁斯大学博士Henry Legg在《自然》杂志发表同行评审论文,对微软拓扑间隙协议(TGP)框架提出质疑,认为该框架在推断Majorana粒子量子态存在方面存在缺陷,且实验数据分析结论可能有误。微软此前宣称将于2029年实现可扩展量子计算机,并推出Majorana 2芯片。对此,微软坚持立场,表示已发表正式反驳并获《自然》收录,对研发路线图充满信心。
上交大与爱丁堡大学提出InfoKV,将信息熵与注意力权重结合用于KV缓存压缩,让大模型在仅保留12.5%缓存的条件下实现接近甚至超越完整缓存的长推理性能。