——基于 AMD EPYC 7H12 处理器的H3CR4950 G5在SPEC CPU 2017基准测试中创两项新世界纪录
2020年10月28日,北京讯——今天,AMD公司(超威,纳斯达克股票代码:AMD)宣布其第二代AMD EPYC处理器为新华三新一代服务器系统提供强劲支持,并带来创纪录的性能。新华三最新发布的服务器产品包括:
H3C UniServer R4950 G5和H3C UniServer R5500 G5服务器,均采用第二代AMD EPYC(霄龙)处理器,其中基于 AMD EPYC 7H12 处理器的H3C R4950 G5在SPEC CPU 2017基准测试中,创造了两路服务器系统SPECspeed®2017_fp_base和SPECspeed®2017_fp_peak测试成绩的两项世界纪录。
H3C UniServer R4950 G5服务器配备两颗第二代AMD EPYC处理器,包括最新的AMDEPYC 7Fx2系列处理器,最高支持128个核心,并兼容下一代AMDEPYC处理器,具备良好的可扩展性,还支持AMD安全内存加密(SME)及安全加密虚拟化(SEV)等增强的安全特性,可广泛应用于互联网、云计算、互联网数据中心(IDC)、企业市场、电信等领域。H3CUniServer R5500 G5服务器采用全新模块化系统架构,专注于AI训练、AI推理、HPC等场景。
AMD全球副总裁兼中国区企业与商用事业部总经理刘宏兵表示:“AMD是一家同时拥有高性能处理器和显卡解决方案的公司。AMD EPYC基于开创性的架构和领先的7nm制造工艺,能提供刷新纪录的性能和颠覆性的TCO,为众多新华三集团的服务器产品提供强大的算力支持,让已经创造了170多项世界纪录的AMD EPYC再创佳绩。AMD期待能与新华三同“芯”共创,以高性能的AMD新一代EPYC处理器,携手新华三加速计算变革。”
新华三集团副总裁、计算存储产品线总裁陈振宽表示:“新华三和AMD携手合作推出的一系列服务器产品,在产品性能、安全性能和总体拥有成本(TCO)方面都极具竞争力。今天,我们期待随着多款采用第二代AMD EPYC处理器的新华三服务器新品的发布,双方的合作可以更上一层楼,基于对客户需求的精准洞察,以更多的解决方案满足不同需求场景的差异化需要,充分释放算力的潜能,持续推动智慧计算的创新和变革。”
在当天举行的新华三智慧计算战略暨新品发布会上,还同时介绍并展示了同样基于第二代AMD EPYC处理器的HPE Apollo系列的Apollo 2000 Gen10 Plus,以及HPE ProLiant系列服务器产品DL325 Gen10 Plus和DL385 Gen10 Plus。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。