近日,MLCommons公布了针对AI推理的MLPerf v4.0基准测试结果。与第四代至强在MLPerf推理v3.1基准测试中的结果相比,第五代至强的测试结果平均提升1.42倍。
其中,针对具备连续批处理(continuous batching)等软件优化的GPT-J模型,与v3.1的测试结果相比,第五代至强的性能提升约1.8倍;同样,得益于MergedEmbeddingBag以及基于英特尔AMX的其他优化,DLRMv2的测试结果显示出约1.8倍的性能提升和99.9的准确率。
与此同时,英特尔非常自豪地与包括思科、戴尔、广达、Supermicro和纬颖科技在内的广大OEM伙伴们展开合作,助力其提交基于自身产品的MLPerf测试结果。英特尔不仅于2020年开始提交基于第四代至强的测试结果,同时至强可扩展处理器亦是参与MLPerf测试的产品中,众多加速器的主机CPU。
此外,第五代至强可在英特尔®开发者云平台上进行评估。该环境中,用户可以进行小型及大规模AI训练(譬如大语言模型或生成式AI)、运行大规模的推理工作负载,以及管理AI计算资源等。
截至目前,英特尔仍是唯一一家提交MLPerf测试结果的CPU厂商。英特尔产品迄今为止在多轮MLPerf基准测试中均所展示出领先的训练及推理性能,该测试结果亦为客户树立了可用于评估产品AI性能的行业标准。
之所以能取得这样的成绩,得益于英特尔®高级矩阵扩展(英特尔® AMX),这也彰显了英特尔致力于通过丰富且具有竞争力的解决方案推动 “AI无处不在”的承诺。
英特尔公司副总裁兼数据中心与人工智能事业部产品管理总经理Zane Ball表示:“我们将持续提升CPU和加速器等广泛产品组合在行业基准测试中的AI性能。此次全新的MLCommons结果显示,我们提供的AI解决方案能够满足客户不断变化、多样化的AI需求。同时,至强处理器也为客户提供了可快速实现AI部署,且极具性价比的选择。”
第五代英特尔®至强®可扩展处理器
好文章,需要你的鼓励
本文探讨代理型 AI 如何推动网络安全变革。CrowdStrike CEO George Kurtz 详细介绍了其在自主威胁响应中的应用及由此带来的新风险,强调了数据驱动策略的重要性。
Ai2 最近发布了名为 Olmo 2 1B 的 10 亿参数小型 AI 模型,在算术推理与事实核查测试中表现优于 Google、Meta 与阿里,尽管存在潜在风险,不建议商业应用。
在人工智能推动海量数据处理需求下,电力短缺问题愈发严重。为突破电网瓶颈,开发商正通过现场发电、天然气和小型模块反应器等措施,确保数据中心高效、可靠地供电。
一项新研究称 LM Arena 平台存在不公正操作,偏向大企业私测的专有模型,而开放模型得不到足够评测,平台运营者对此表示争议。