与Arm、Ampere、Cray、富士通、HPE、Marvell携手构建GPU加速服务器,以满足从超大规模云到边缘、从模拟到AI、从高性能存储到百万兆级超级计算等多样化需求
NVIDIA于今日发布一款参考设计平台,使企业能够快速构建GPU加速的Arm服务器,以满足日益多样化的科学和工业应用需求。这开辟了高性能计算的新纪元。
NVIDIA创始人兼首席执行官黄仁勋在2019国际超级计算大会(SC19)上宣布推出这款参考设计平台。该平台由硬件和软件基础模块组成,能够满足高性能计算(HPC)社区对于类型更加多样化的CPU架构日益增长的需求。通过该平台,超级计算中心、超大型云运营商和企业能够将NVIDIA加速计算平台的优势与最新的Arm服务器平台相结合。
为了构建这一参考平台,NVIDIA与Arm及其生态合作伙伴(包括Ampere、富士通和Marvell)联手,以确保NVIDIA GPU与Arm处理器之间的无缝协作。该参考平台还得益于与HPE旗下公司Cray和HPE这两家早期采用Arm服务器的供应商之间的紧密合作。此外,许多高性能计算软件公司已使用NVIDIA CUDA-X库来构建可在Arm服务器上运行、并可通过GPU实现的管理和监控工具。
黄仁勋表示:“高性能计算正在崛起。机器学习和AI领域的突破正在重新定义科学研究方法,并且可能带来激动人心的新架构。从超大规模云到百万兆级超级计算,NVIDIA GPU与ARM的组合让创新者们能够为不断增加的新应用创建系统。”
Arm IP产品部门总裁Rene Haas表示:“ Arm正在与生态合作伙伴一同努力,为百万兆级的Arm系统级芯片提供前所未有的性能和效率。我们与NVIDIA合作,将CUDA加速带入到Arm架构当中,这对于高性能计算社区来说,具有里程碑式的意义。为了应对全球最复杂的研究,挑战并推动嵌入式系统、汽车和边缘细分市场的进一步发展,高性能计算社区已经在部署Arm技术。”
今年早些时候,NVIDIA宣布为Arm带来CUDA-X软件平台。NVIDIA此次发布这一参考平台正是对此前承诺的兑现。根据这一承诺,NVIDIA正在提供其Arm兼容软件开发套件的预览版本。该版本包含NVIDIA CUDA-X库和加速计算开发工具。
除了使自己的软件兼容Arm之外,NVIDIA还与 GROMACS、LAMMPS、MILC、NAMD、Quantum Espresso和Relion等领先的高性能计算应用开发商密切合作,为ARM提供GPU加速的应程序用。为了让Arm平台上的应用实现GPU加速,NVIDIA及其高性能计算应用生态合作伙伴编译了大量代码。
为了构建Arm生态,NVIDIA与领先的Linux发行商Canonical、Red Hat、SUSE,以及业内领先的高性能计算基础工具供应商展开合作。
几家世界级的超级计算中心已开始测试GPU加速Arm计算系统,其中包括美国的橡树岭国家实验室和桑迪亚国家实验室、英国布里斯托大学以及日本理化学研究所。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。