据近日业界发布的评测报告显示,以浪潮GPU服务器NF5468A5为平台,搭载2颗AMD Milan-X 7773X运行常见的气象应用WRF和计算流体力学应用OpenFOAM作为性能基准测试,其性能相比搭载两颗Rome 7742时的计算性能提升可高达80%。
NF5468A5是一款4U支持2颗AMD EPYC处理器和8颗双宽GPU卡,面向AI训练、推理、视频编解码等多种应用场景的GPU服务器。此次测试采用分别搭载2颗AMD Milan-X 7773X、Milan 7543和Rome 7742的配置组合。
AMD Milan-X处理器最大的亮点,就是采用3D堆叠技术(3D V-Cache),在不改变处理器面积的前提下,可用L3 缓存(SRAM)总数增加三倍。做个形象的比喻,这种3D堆叠技术就像将把相同面积的平房升级成三层小楼,通过纵向空间成倍扩展缓存数量。评测采用的NF5468A5平台是浪潮信息畅销海内外的弹性云AI服务器NF5468系列的全新产品,率先支持PCIe 4.0技术,4U空间内可装载2颗采用7nm先进制程工艺的AMD EPYC处理器和8块PCIe Gen4接口的AI加速卡,能够最大限度的发挥Milan-X处理器的极致性能。
WRF(The Weather Research and Forecasting Model),即天气预报模式,被誉为是次世代的中尺度天气预报模式,往往用于大范围高分辨的气候模拟,对系统的运算性能、内存的要求非常高;OpenFOAM(Open Source Field Operation and Manipulation)是对连续介质力学问题进行数值计算的软件,经常应用于汽车仿真等行业,进行仿真计算需要处理大量的实时数据,所以对系统的计算能力、数据吞吐能力都有很高的要求。
基于浪潮NF5468A5评测报告显示,Milan-X处理器通过搭载3D堆叠技术获得更高的L3缓存,确实对计算性能有较大提升,而性能改进意味着企业可以在更少的服务器上运行相同的作业,消耗的功率也能有明显降低。如下是评测报告中的性能测试数据:
在WRF测试中,使用单节点相同核心数,以Rome 7742处理器运行时间为基准,在Milan 7543上的计算性能提升14%~27%,而在Milan-X 7773X处理器上性能提升 23%~34%。
在OpenFOAM基准算例motorBike测试中,使用不可压稳态求解器simpleFoam计算模拟摩托车和骑手周围空气的运动情况。同样以Rome 7742处理器为基准,OpenFOAM在Milan 7543处理器使用单节点相同核心测试性能提升23%~28%,在Milan-X 7773X处理器上性能提升34%~80%。
在本次评测中也对NF5468A5有比较细致的介绍,据浪潮官网显示NF5468A5正在推出“超值机型 限免试用”,对该GPU服务器感兴趣的不妨一试。如下是评测中对于浪潮NF5468A5的介绍:
NF5468A5采用分区散热设计,内置独立的CPU和GPU主板,且分别安装在不同的平面。从机箱内部结构来看,设计者将发热量高的的GPU放在了机箱上3U空间,CPU板处于机箱下1U,内置6对12个6056风扇模组配合导风罩,实现机箱内风道分流,正是基于这种独特分层散热设计,使得送测的NF5468A5服务器可以支持280W最高功耗的Milan-X 7773X。系统设计支持32条DDR4 ECC内存,支持LRDIMM/RDIMM,提供高达8T的本地内存,实现与1536 MB 超大L3 cache间的高速数据交互。
NF5468A5采用了CPU直连GPU架构设计,率先支持PCI-E 4.0技术,最大限度提升CPU与GPU间的带宽,降低通信延迟,达到最佳效能,为客户提供极致优化的算力。系统提供丰富的IO扩展能力,提供10个PCIe 4.0 X16扩展槽位,支持8个全高全长的GPU加速卡。提供灵活存储方案,可选前置12 × 3.5英寸硬盘或24 × 2.5英寸硬盘,提供超大的本地存储能力,同时最大可支持8个热插拔NVMe SSD全闪配置,提供存储到内存到L3 cache的高速访存,可实现十倍于高端企业级SATA SSD的IOPS性能,带来极致IO存储性能飞跃。
好文章,需要你的鼓励
美国网络安全和基础设施安全局指示联邦机构修补影响思科ASA 5500-X系列防火墙设备的两个零日漏洞CVE-2025-20362和CVE-2025-20333。这些漏洞可绕过VPN身份验证并获取root访问权限,已被黑客积极利用。攻击与国家支持的ArcaneDoor黑客活动有关,黑客通过漏洞安装bootkit恶意软件并操控只读存储器实现持久化。思科已发布补丁,CISA要求机构清点易受攻击系统并在今日前完成修补。
康考迪亚大学研究团队通过对比混合量子-经典神经网络与传统模型在三个基准数据集上的表现,发现量子增强模型在准确率、训练速度和资源效率方面均显著优于传统方法。研究显示混合模型的优势随数据集复杂度提升而增强,在CIFAR100上准确率提升9.44%,训练速度提升5-12倍,且参数更少。该成果为实用化量子增强人工智能铺平道路。
TimeWave是一款功能全面的计时器应用,超越了苹果自带时钟应用的功能。它支持创建流式计时器,让用户可以设置连续的任务计时,帮助专注工作。应用采用简洁的黑白设计,融入了Liquid Glass元素。内置冥想、番茄工作法、20-20-20护眼等多种计时模式,支持实时活动显示和Siri快捷指令。免费版提供基础功能,高级版需付费订阅。
沙特KAUST大学团队开发了专门针对阿拉伯语的AI模型家族"Hala",通过创新的"翻译再调优"技术路线,将高质量英语指令数据转化为450万规模的阿拉伯语语料库,训练出350M到9B参数的多个模型。在阿拉伯语专项测试中,Hala在同规模模型中表现最佳,证明了语言专门化策略的有效性,为阿拉伯语AI发展和其他语言的专门化模型提供了可复制的技术方案。