英特尔产品在全新MLCommons AI推理性能测试中尽显优势
今日,MLCommons公布针对 60 亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的 MLPerf推理v3.1 性能基准测试结果,其中包括英特尔所提交的基于Habana® Gaudi®2 加速器、第四代英特尔®至强®可扩展处理器,以及英特尔®至强® CPU Max 系列的测试结果。该结果显示了英特尔在AI推理方面极具竞争力的表现,并进一步加强了其对加速从云到网络到边缘再到端的工作负载中大规模部署AI的承诺。
英特尔执行副总裁兼数据中心与人工智能事业部总经理Sandra Rivera表示:“正如最新的 MLCommons结果显示,我们拥有强大的、具有竞争力的人工智能产品组合以满足客户对高性能、高效率的深度学习推理及训练的需求,同时,针对各种规模的人工智能模型,英特尔产品组合均具有领先的性价比优势。”
根据6月披露的MLCommons AI训练结果和Hugging Face性能基准测试验证,Gaudi2 在先进的视觉语言模型上拥有卓越的性能,而今天的结果进一步证明了英特尔能够提供满足AI计算需求的绝佳解决方案。
考虑到客户的个性化需求,英特尔正在通过能够帮助解决AI工作负载中推理与训练问题的产品,让AI无处不在。英特尔的AI产品为客户提供了可根据各自性能、效率及目标成本进行灵活匹配以获取最佳AI解决方案的理想选择,同时亦帮助客户开放生态系统。
关于Habana Gaudi2的测试结果:
Habana Gaudi2 在GPT-J模型上的推理结果强有力地验证了其具有竞争力的性能。
随着每6-8周公布的 Gaudi2 软件更新,英特尔将继续在 MLPerf 基准测试中展现其产品的性能提升,以及持续扩大的模型覆盖范围。

Habana Gaudi2 在GPT-J模型上的推理结果验证了其具有竞争力的性能
关于第四代至强可扩展处理器的测试结果:
英特尔提交了基于第四代英特尔至强可扩展处理器的7个推理基准测试,其中包括GPT-J模型。结果显示,包括视觉、语言处理、语音和音频翻译模型,以及更大的 DLRM v2 深度学习推荐模型及ChatGPT-J 模型在内,第四代至强处理器对于通用 AI 工作负载拥有出色的性能。此外,截至目前,英特尔仍是唯一一家使用行业标准的深度学习生态系统软件提交公开 CPU 结果的厂商。

第四代至强可扩展处理器是构建及部署通用AI工作负载的理想选择
MLPerf 是业内享有盛名的 AI 性能基准测试,旨在实现公平、可重复的产品性能比较。英特尔计划为下一个 MLPerf测试提交新的AI训练性能结果。持续的性能更新彰显了英特尔致力于帮助客户、助力AI技术演进所迈出的每一步,无论是低成本的AI处理器,还是面向网络、云和企业用户的高性能AI硬件加速器或是 GPU。
好文章,需要你的鼓励
联想推出全新数据存储产品和服务,旨在满足企业AI应用日益增长的需求。新产品包括ThinkAgile FX系列、ThinkSystem DS存储阵列等,提供开放灵活的硬件软件配置。研究显示63%的企业尚未为AI功能做好准备,联想通过混合云服务、数据生命周期管理等解决方案,帮助客户实现基础设施现代化,降低实施风险并提升投资回报率。
北京大学团队开发的DragMesh系统通过简单拖拽操作实现3D物体的物理真实交互。该系统采用分工合作架构,结合语义理解、几何预测和动画生成三个模块,在保证运动精度的同时将计算开销降至现有方法的五分之一。系统支持实时交互,无需重新训练即可处理新物体,为虚拟现实和游戏开发提供了高效解决方案。
英伟达宣布收购开源工作负载管理系统Slurm的主要开发商SchedMD,该系统专为高性能计算和AI设计。同时发布Nemotron 3系列开源AI模型,包括面向特定任务的Nano、多智能体应用的Super和复杂任务的Ultra三个版本。英伟达CEO黄仁勋表示,开放创新是AI进步的基础,将通过透明高效的开放平台帮助开发者构建大规模智能体系统。
达尔豪斯大学研究团队系统性批判了当前AI多智能体模拟的静态框架局限,提出以"动态场景演化、智能体-环境共同演化、生成式智能体架构"为核心的开放式模拟范式。该研究突破传统任务导向模式,强调AI智能体应具备自主探索、社会学习和环境重塑能力,为政策制定、教育创新和社会治理提供前所未有的模拟工具。