近日,MLCommons公布了最新的MLPerf推理v5.0基准测试结果,其中,英特尔® 至强® 6性能核处理器在本次测试的六个关键项目中,性能表现卓越。测试结果显示,相较于上一代产品,该处理器的AI性能实现了高达1.9倍的显著提升,这也充分显示了至强6处理器作为现代AI系统理想解决方案的强大实力。
英特尔公司副总裁兼数据中心和人工智能事业部临时总经理Karin Eibschitz Segal表示,“从最新的MLPerf基准测试结果可以看到,英特尔至强6处理器凭借性能和能效的平衡,已成为适合AI应用的理想CPU。而作为AI系统中被广泛应用的领先CPU,每一代英特尔至强处理器均在多项AI基准测试中,持续展现出卓越的代际性能提升。”
现阶段,AI应用正在加速发展,而作为AI系统中的核心节点,CPU负责数据预处理、传输和系统编排等关键功能,扮演着不可或缺的角色。深耕处理器领域多年,英特尔是唯一一家持续向MLPerf提交服务器CPU测试结果的厂商,并凭借其卓越的性能和能效表现,持续引领行业标准。
在MLPerf推理v5.0中,相较于第五代英特尔® 至强® 处理器,英特尔® 至强® 6性能核处理器在包括ResNet50、RetinaNet、3D-UNet和新的GNN-RGAT的关键基准测试中,平均性能提升达1.9倍。这有力地证明了英特尔至强6作为AI系统首选CPU的优势,并彰显了至强处理器在小型语言模型中的强大实力。
自2021年首次提交基于第三代英特尔® 至强® 处理器的MLPerf测试结果以来,英特尔在ResNet50上实现了高达15倍的巨大性能提升。软件优化也让GPT-J性能提升了22%,并使3D U-Net基准测试性能提升了11%。
最新的MLPerf结果显示,英特尔至强处理器在OEM厂商和生态系统合作伙伴提供的解决方案中拥有卓越的性能表现。随着AI工作负载与企业系统的集成度越来越高,OEM厂商倾向于优先选择基于至强处理器的系统,以确保能为客户提供领先的性能。
英特尔与思科、戴尔科技、广达和超微四家重要的OEM合作伙伴携手合作,分别提交了基于英特尔至强6性能核处理器的测试结果,展示了多样化的AI工作负载和部署能力。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。