AMD 今天(5 月 13 日)宣布推出其 Zen 5 Epyc 服务器处理器的入门级版本,目标客户为中小企业及托管 IT 服务提供商。
新推出的 Epyc 4005 系列 CPU 是在 AMD 推出其最新一代高性能、节能 Epyc 处理器——第五代 Epyc 服务器处理器 后七个月所发布的。
较少核心,价格更低
Epyc 4005 系列芯片提供 6 至 16 核的配置,主要面向小型企业及提供专用托管服务的供应商。相比之下,高端 Epyc 9000 系列最高可达到 192 核。
AMD 服务器解决方案组的产品营销经理 Dennis McQueen 在本周媒体简报会上表示:“我们把性能下沉,仍然采用相同的 AM5 socket,并且针对这一市场定位制定了价格。”
新款 Epyc 4005 系列芯片是对去年发布并采用 AMD 之前 Zen 4 核心架构打造的 Epyc 4004 系列芯片的更新。
4000 系列填补了公司产品线中的一个空白,以便在服务器处理器市场中更好地与 Intel 进行竞争。
McQueen 补充说:“我们意识到之前并未很好地服务于中小企业及专用托管市场,因此大约在去年此时,我们推出了 4004 系列处理器,并且反响非常好。”
AMD 入门级 Epyc 4005 系列处理器具有 6 至 16 核,采用 AM5 socket。Image: AMD.
为本地部署环境带来更快的处理速度
TECHnalysis Research 总裁兼首席分析师 Bob O’Donnell 表示,AMD 新推出的 4005 系列芯片相较前代提供了更快的内存访问速度,对于仍在本地运行传统计算负载或自定义应用(如 Exchange 服务器、内容管理系统或人力资源与销售应用程序)的中小企业来说,是一个不错的选择。
O’Donnell 表示:“该产品专为低端数据中心设计。对于那些仍在使用效率较低旧服务器的企业来说,这款处理器在性能和能效方面均能带来显著提升。”
AI 增强型工作负载
AMD 高管指出,Epyc 4005 系列 CPU 针对提供虚拟化、电子商务和网站托管应用的 IT 服务提供商进行了量身定制。
公司同时表示,企业也可以利用这款新芯片来处理 AI 增强型工作负载。目前支持新芯片的硬件厂商包括 Lenovo、Supermicro、MSI 与 Gigabyte。
去年,AMD 获得了来自 Hetzner、OVHcloud 与 Scaleway 等欧洲服务提供商的大力支持。如今,McQueen 表示 AMD 已开始吸引来自美国与亚洲的服务提供商。
总部位于美国的 Vultr 已宣布,其基于 Epyc 4005 系列处理器的裸金属与云计算实例现已可以立即使用。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。