AMD今天宣布推出用于数据中心的第二代EPYC处理芯片,并公布了包括谷歌和推特在内的知名大客户。
AMD的第二代AMD EPYC处理器采用合约制造商的新技术制造,可提供更好的性能,同时功耗低于上一代芯片。EPYC芯片采用最先进的7纳米工艺制造,具有多达64个“Zen 2”核心,这一点使其实现了创纪录的性能,同时在运行很多数据中心工作负载方面总拥有成本降低多达50%。
AMD总裁兼首席执行官Lisa Su在发布会主题演讲中表示:“今天,我们为现代数据中心设立了新的标准,多家企业、云和高性能计算新客户选择EPYC处理器来满足他们最苛刻的服务器计算需求,从而加速了我们领先服务器处理器的普及速度。”
在这次发布会上,AMD高管花了大量时间讨论第二代EPYC芯片的性能改进。例如他们声称EPYC芯片在Java应用工作负载方面的性能提高了83%,还强调了该芯片的“创纪录虚拟化性能”和在高性能计算工作负载中实现“创纪录的浮点性能”。
AMD方面补充说,EPYC在服务器工作负载每个核心每个时钟执行的指令增加了23%,而L3缓存多达上一代的4倍。
Moor Insights&Strategy分析师Patrick Moorhead表示,这款新芯片的推出对于AMD来说是一大进步,远远超出他的预期。
“AMD改进了第一代的大部分缺点,如单线程性能和核心扩展,并增加了新的RAS和安全功能,以及提升了多核心性能,”Moorhead说。
AMD在数据中心芯片领域的主要竞争对手是英特尔,近年来,两家厂商都越来越重视这些主要用于支持互联网服务的芯片,因为PC销售量一直在下滑。
Moorhead表示,他期待AMD在发布上一代芯片之后取得了一些收益之后,能够通过推出第二代EPYC芯片在与英特尔的竞争中取得优势。
他说:“AMD推出第一代EPYC的时候份额只有个位数的小幅增长,不过我预计AMD通过推出第二代EPYC能够在云服务提供商、企业和高性能计算领域获得拿下一些份额。企业不会大规模部署任何第一代产品。他们没有部署第一代EPYC,但他们将部署第二代EPYC。”
AMD可以充分利用这样一个事实:那就是英特尔是在它自己的工厂生产芯片,而不是依靠承包商,导致7纳米制造工艺落后于时间表,这些芯片预计最早要到2021年才会到货。
这也被认为是AMD能够撬动英特尔一些最大客户(包括谷歌)的原因之一。
谷歌高管出现在AMD的这次发布会上,表示谷歌已经部署了AMD的第二代EPYC处理器,用于处理部分云数据中心的特定工作负载。今年晚些时候,谷歌还将采用这款芯片来支持针对Google Cloud Compute Engine服务的“通用型”设备。
“谷歌是个有意思的客户,已经明确表示如果能够看到更好的性能和价格就会有更大投入。谷歌曾经是AMD Opteron的最大客户。对此我会密切关注。”
推特(Twitter)也成为AMD的一大客户。这家社交媒体公司表示。将在今年晚些时候在其数据中心内部署AMD EPYC芯片,预计这将使总体拥有成本降低25%。
微软也宣布推出了针对基于EPYC芯片的通用设备的新Azure虚拟机预览。此外,微软还还宣布了云远程桌面和基于新架构高性能计算工作负载的有限预览。
数据中心硬件厂商HPE和联想也宣布推出基于EPYC芯片的新平台,包括HPE ProLiant DL385和ProLiant DL325服务器,以及联想的ThinkSystem SR655和SR635服务器。
好文章,需要你的鼓励
本文探讨了达成人工通用智能(AGI)七大路线中的线性进阶路径,预测了从2025年至2040年 AI 技术与社会效应的关键年度节点。
这项研究介绍了一种新型多模态扩散模型,能够同时生成量子电路的离散结构和连续参数。由因斯布鲁克大学和NVIDIA公司研究人员开发,该模型利用两个独立但协同工作的扩散过程处理门类型选择和参数预测,克服了传统量子电路编译方法的效率瓶颈。研究证明了该模型在不同量子比特数量、电路深度和参数化门比例下的有效性,并通过快速电路生成创建了数据集,从中提取出有价值的结构见解,为量子电路合成提供了新方向。
SenseFlow是香港科技大学等机构联合开发的文本到图像蒸馏技术,解决了大型流匹配模型蒸馏的三大难题。研究团队提出隐式分布对齐(IDA)稳定训练过程,段内引导(ISG)优化时间步重要性分配,并设计基于视觉基础模型的判别器提升生成质量。实验表明,SenseFlow能将SD 3.5和FLUX等12B参数级模型成功蒸馏为仅需4步生成的高效版本,同时保持甚至超越原模型在多项指标上的表现,代表了AI图像生成效率提升的重要突破。
MASKSEARCH是阿里巴巴集团同义实验室开发的新型预训练框架,通过创新的"检索增强掩码预测"任务,训练大型语言模型像人类一样主动使用搜索工具获取信息。这项框架包含两个阶段:首先在掩码预测任务上预训练,然后在下游任务上微调,大幅提升模型在开放域问答中的表现。研究采用监督微调和强化学习两种方法,结合多代理系统和课程学习策略,使AI能够自主分解问题、使用搜索工具并基于搜索结果进行推理。