至顶网服务器频道 05月18日 新闻消息:AMD日前将旗下的Zen-based Naples处理器更名为EPYC,并将其作为数据中心服务器CPU推广,AMD希望借此进军双插槽和单插槽服务器市场。
我们曾在3月博文里介绍过那不勒斯,我们当时列出了一些规格资料:
·可扩展32核系统芯片(SoC)设计,每内核两个线程
·8个内存通道上最多16个DDR4 DIMM,高达2TB的内存容量
·支持16个内存通道上最多32个DIMM的DDR4 ,在 2插槽服务器中提供高达4TB的总内存容量
·完整系统芯片,完整整合了支持128通道PCIe 3 的IO,
·用于高能效的计算的高性能缓存结构
·2插槽系统那不勒斯CPU带Infinity Fabric相干互连
·专用安全硬件
EYPC品牌下这些规格没变,但我们现在对其性能了解得更多了。
2017年AMD金融分析师日上有个演示,单个EPYC处理器击败了至强E5-2699A v4,该至强的内核数多45%,内存容量多60%,内存带宽多122%。
至于这些东西究竟可以如何改进应用程序速度, 笔者也不知道。
另据悉,英特尔即将推出Xeon SP,因此AMD又要针对Xeon SP青铜和银色CPU再做比较。比较的结果肯定值得一读。
现在大家都知道高端Platinum Xeon SP运行SAP HANA的速度比Xeon E7-8890 v4提升了1.6倍。假如(大大的一个假如)其他Xeon SP及其他Xeon E7和E5的性能提升不差上下的话,那么,AMD在市场营销上可能会面临一些问题。 AMD一定不希望在营销上面临这些问题。
IDC高级副总裁Matthew Eastwood说了一段很到位的话,“时下的单插槽服务器产品在推着买家去购买更昂贵的双插槽服务器,买家这样做只是为了获得内存带宽和IO,买家需要内存带宽和IO,以支持内核的计算性能……EPYC提供了单处理器解决方案,可以为现在的工作负载提供合适数量的高性能内核、内存和IO。
第一款基于EPYC的服务器将于6月推出,AMD希望该款服务器可以得到OEM和渠道合作伙伴的广泛支持。 Dropbox正在评估EYPC CPU。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。