与Arm、Ampere、Cray、富士通、HPE、Marvell携手构建GPU加速服务器,以满足从超大规模云到边缘、从模拟到AI、从高性能存储到百万兆级超级计算等多样化需求
NVIDIA于今日发布一款参考设计平台,使企业能够快速构建GPU加速的Arm服务器,以满足日益多样化的科学和工业应用需求。这开辟了高性能计算的新纪元。
NVIDIA创始人兼首席执行官黄仁勋在2019国际超级计算大会(SC19)上宣布推出这款参考设计平台。该平台由硬件和软件基础模块组成,能够满足高性能计算(HPC)社区对于类型更加多样化的CPU架构日益增长的需求。通过该平台,超级计算中心、超大型云运营商和企业能够将NVIDIA加速计算平台的优势与最新的Arm服务器平台相结合。
为了构建这一参考平台,NVIDIA与Arm及其生态合作伙伴(包括Ampere、富士通和Marvell)联手,以确保NVIDIA GPU与Arm处理器之间的无缝协作。该参考平台还得益于与HPE旗下公司Cray和HPE这两家早期采用Arm服务器的供应商之间的紧密合作。此外,许多高性能计算软件公司已使用NVIDIA CUDA-X库来构建可在Arm服务器上运行、并可通过GPU实现的管理和监控工具。
黄仁勋表示:“高性能计算正在崛起。机器学习和AI领域的突破正在重新定义科学研究方法,并且可能带来激动人心的新架构。从超大规模云到百万兆级超级计算,NVIDIA GPU与ARM的组合让创新者们能够为不断增加的新应用创建系统。”
Arm IP产品部门总裁Rene Haas表示:“ Arm正在与生态合作伙伴一同努力,为百万兆级的Arm系统级芯片提供前所未有的性能和效率。我们与NVIDIA合作,将CUDA加速带入到Arm架构当中,这对于高性能计算社区来说,具有里程碑式的意义。为了应对全球最复杂的研究,挑战并推动嵌入式系统、汽车和边缘细分市场的进一步发展,高性能计算社区已经在部署Arm技术。”
今年早些时候,NVIDIA宣布为Arm带来CUDA-X软件平台。NVIDIA此次发布这一参考平台正是对此前承诺的兑现。根据这一承诺,NVIDIA正在提供其Arm兼容软件开发套件的预览版本。该版本包含NVIDIA CUDA-X库和加速计算开发工具。
除了使自己的软件兼容Arm之外,NVIDIA还与 GROMACS、LAMMPS、MILC、NAMD、Quantum Espresso和Relion等领先的高性能计算应用开发商密切合作,为ARM提供GPU加速的应程序用。为了让Arm平台上的应用实现GPU加速,NVIDIA及其高性能计算应用生态合作伙伴编译了大量代码。
为了构建Arm生态,NVIDIA与领先的Linux发行商Canonical、Red Hat、SUSE,以及业内领先的高性能计算基础工具供应商展开合作。
几家世界级的超级计算中心已开始测试GPU加速Arm计算系统,其中包括美国的橡树岭国家实验室和桑迪亚国家实验室、英国布里斯托大学以及日本理化学研究所。
好文章,需要你的鼓励
最新数据显示,Windows 11市场份额已达50.24%,首次超越Windows 10的46.84%。这一转变主要源于Windows 10即将于2025年10月14日结束支持,企业用户加速迁移。一年前Windows 10份额还高达66.04%,而Windows 11仅为29.75%。企业多采用分批迁移策略,部分选择付费延长支持或转向Windows 365。硬件销售受限,AI PC等高端产品销量平平,市场份额提升更多来自系统升级而非新设备采购。
清华大学团队开发出LangScene-X系统,仅需两张照片就能重建完整的3D语言场景。该系统通过TriMap视频扩散模型生成RGB图像、法线图和语义图,配合语言量化压缩器实现高效特征处理,最终构建可进行自然语言查询的三维空间。实验显示其准确率比现有方法提高10-30%,为VR/AR、机器人导航、智能搜索等应用提供了新的技术路径。
新一代液态基础模型突破传统变换器架构,能耗降低10-20倍,可直接在手机等边缘设备运行。该技术基于线虫大脑结构开发,支持离线运行,无需云服务和数据中心基础设施。在性能基准测试中已超越同等规模的Meta Llama和微软Phi模型,为企业级应用和边缘计算提供低成本、高性能解决方案,在隐私保护、安全性和低延迟方面具有显著优势。
IntelliGen AI推出IntFold可控蛋白质结构预测模型,不仅达到AlphaFold 3同等精度,更具备独特的"可控性"特征。该系统能根据需求定制预测特定蛋白质状态,在药物结合亲和力预测等关键应用中表现突出。通过模块化适配器设计,IntFold可高效适应不同任务而无需重新训练,为精准医学和药物发现开辟了新路径。