近日,MLCommons公布了针对AI推理的MLPerf v4.0基准测试结果。与第四代至强在MLPerf推理v3.1基准测试中的结果相比,第五代至强的测试结果平均提升1.42倍。
其中,针对具备连续批处理(continuous batching)等软件优化的GPT-J模型,与v3.1的测试结果相比,第五代至强的性能提升约1.8倍;同样,得益于MergedEmbeddingBag以及基于英特尔AMX的其他优化,DLRMv2的测试结果显示出约1.8倍的性能提升和99.9的准确率。
与此同时,英特尔非常自豪地与包括思科、戴尔、广达、Supermicro和纬颖科技在内的广大OEM伙伴们展开合作,助力其提交基于自身产品的MLPerf测试结果。英特尔不仅于2020年开始提交基于第四代至强的测试结果,同时至强可扩展处理器亦是参与MLPerf测试的产品中,众多加速器的主机CPU。
此外,第五代至强可在英特尔®开发者云平台上进行评估。该环境中,用户可以进行小型及大规模AI训练(譬如大语言模型或生成式AI)、运行大规模的推理工作负载,以及管理AI计算资源等。
截至目前,英特尔仍是唯一一家提交MLPerf测试结果的CPU厂商。英特尔产品迄今为止在多轮MLPerf基准测试中均所展示出领先的训练及推理性能,该测试结果亦为客户树立了可用于评估产品AI性能的行业标准。
之所以能取得这样的成绩,得益于英特尔®高级矩阵扩展(英特尔® AMX),这也彰显了英特尔致力于通过丰富且具有竞争力的解决方案推动 “AI无处不在”的承诺。
英特尔公司副总裁兼数据中心与人工智能事业部产品管理总经理Zane Ball表示:“我们将持续提升CPU和加速器等广泛产品组合在行业基准测试中的AI性能。此次全新的MLCommons结果显示,我们提供的AI解决方案能够满足客户不断变化、多样化的AI需求。同时,至强处理器也为客户提供了可快速实现AI部署,且极具性价比的选择。”
第五代英特尔®至强®可扩展处理器
好文章,需要你的鼓励
Podcastle是一款播客录制和编辑平台,现已推出名为Asyncflow v1.0的AI文本转语音模型,并为开发者提供API接口,方便其在应用中直接集成该模型。新模型支持超过450种AI语音,能够为文本进行朗读。该公司表示,其技术和模型的训练及推理成本较低,使其在竞争中具备优势。Podcastle的创始人Arto Yeritsyan表示,尽管开发成本高昂,但得益于最近的大型语言模型进展,Podcastle终于能够在不需要大量数据的情况下构建高质量的语音模型。
Fluro 提供了一天内你需要了解的所有信息的精彩回顾,界面简洁,配有特别的 LED 滚动条。它提供天气、日历事件、提醒、新闻等信息,带有一丝怀旧的气息。
随着行业领先企业在巴塞罗那的MWC展示他们如何推动移动通信,全球移动行业贸易组织GSMA的报告呼吁各国政府优先考虑促进投资的政策,以加速网络扩展、增强数字经济并支持持续的移动网络扩展和创新。GSMA强调,政府必须优先考虑创造积极的投资环境的政策,以释放数字经济的全部潜力。
日本领先的运营商 NTT Docomo 在 MWC 2025 会议上展示了下一代通信技术和服务的“基础性进展”,这些技术和服务将支持未来十年对网络基础设施的前所未有的需求。NTT Docomo 与 Toppan 签署协议,共同开发即将到来的 6G 时代的通信服务,Toppan 将其信息处理和计算机图形的专业知识应用于多种元宇宙服务。