近日,MLCommons公布了最新的MLPerf推理v5.0基准测试结果,其中,英特尔® 至强® 6性能核处理器在本次测试的六个关键项目中,性能表现卓越。测试结果显示,相较于上一代产品,该处理器的AI性能实现了高达1.9倍的显著提升,这也充分显示了至强6处理器作为现代AI系统理想解决方案的强大实力。
英特尔公司副总裁兼数据中心和人工智能事业部临时总经理Karin Eibschitz Segal表示,“从最新的MLPerf基准测试结果可以看到,英特尔至强6处理器凭借性能和能效的平衡,已成为适合AI应用的理想CPU。而作为AI系统中被广泛应用的领先CPU,每一代英特尔至强处理器均在多项AI基准测试中,持续展现出卓越的代际性能提升。”
现阶段,AI应用正在加速发展,而作为AI系统中的核心节点,CPU负责数据预处理、传输和系统编排等关键功能,扮演着不可或缺的角色。深耕处理器领域多年,英特尔是唯一一家持续向MLPerf提交服务器CPU测试结果的厂商,并凭借其卓越的性能和能效表现,持续引领行业标准。
在MLPerf推理v5.0中,相较于第五代英特尔® 至强® 处理器,英特尔® 至强® 6性能核处理器在包括ResNet50、RetinaNet、3D-UNet和新的GNN-RGAT的关键基准测试中,平均性能提升达1.9倍。这有力地证明了英特尔至强6作为AI系统首选CPU的优势,并彰显了至强处理器在小型语言模型中的强大实力。
自2021年首次提交基于第三代英特尔® 至强® 处理器的MLPerf测试结果以来,英特尔在ResNet50上实现了高达15倍的巨大性能提升。软件优化也让GPT-J性能提升了22%,并使3D U-Net基准测试性能提升了11%。

最新的MLPerf结果显示,英特尔至强处理器在OEM厂商和生态系统合作伙伴提供的解决方案中拥有卓越的性能表现。随着AI工作负载与企业系统的集成度越来越高,OEM厂商倾向于优先选择基于至强处理器的系统,以确保能为客户提供领先的性能。
英特尔与思科、戴尔科技、广达和超微四家重要的OEM合作伙伴携手合作,分别提交了基于英特尔至强6性能核处理器的测试结果,展示了多样化的AI工作负载和部署能力。
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。