美国东部时间12月1日,国际权威AI基准测试MLPerf™公布最新一期训练(Training)榜单V1.1。在全部16个固定任务(Closed Division)测试中,浪潮信息和英伟达包揽15个冠军。
在单机测试的8项任务中,浪潮信息获7项冠军,英伟达获1项冠军;在集群测试的8项任务中,英伟达获7项冠军,微软云获1项冠军。
谷歌、微软云、英伟达、浪潮信息、百度、戴尔等14家公司及科研机构,参与此次MLPerf™基准测试,共提交180项固定任务(Closed)成绩,6项开放任务(Open)成绩。固定任务要求参赛各方使用与参考模型等价的模型和限定的优化器,这对于实际用户评测AI计算系统性能具备很强的参考意义,也一直是MLPerf™中角逐最激烈及主流厂商最关注的领域。
本次MLPerf™基准评测涵盖8类极具代表性的机器学习任务,分别为图像识别(ResNet)、医学影像分割(U-Net3D)、目标物体检测(SSD)、目标物体检测(Mask R-CNN)、语音识别(RNN-T)、自然语言理解(BERT)、智能推荐(DLRM)以及强化学习(MiniGo)。
在单机系统测试的8项任务中,浪潮信息获7项冠军,相较半年前的V1.0竞赛最佳成绩,将医学影像识别、语音识别、智能推荐和自然语言理解任务的AI训练速度分别提升18%、14%、11%和8%。英伟达在单机测试中获得强化学习1项冠军,训练速度相较V1.0提升2%。
在集群系统测试的8项任务中,英伟达获7项冠军,相较于V1.0竞赛最佳成绩将自然语言理解、目标物体检测(MASK R-CNN)、语音识别任务的AI训练速度分别提升22%、18%、14%。微软云夺得1项冠军,以1.26分钟完成医学影像分割任务训练,训练速度相较V1.0提升58%。
MLPerf™每年组织AI推理及AI训练性能测试各2次。目前,MLPerf™ 2021年度4次测试正式收官。作为业内最权威的AI基准测试,本年度共29家国际厂商、研究机构参与其中,在数据中心推理、边缘推理、集群训练和单机训练各类AI场景下,不断突破AI系统性能。其中,浪潮信息共斩获44项冠军,名列MLPerfTM2021年度冠军榜首,英伟达、戴尔、高通分列第二、第三、第四。
关于MLPerf™:MLPerf™是影响力最广的国际AI性能基准评测,由图灵奖得主大卫•帕特森(David Patterson)联合顶尖学术机构发起成立。2020年,非盈利性机器学习开放组织MLCommons基于MLPerf™基准测试成立,成员包括谷歌、Facebook、英伟达、英特尔、浪潮、哈佛大学、斯坦福大学、加州大学伯克利分校等50余家全球AI领军企业及顶尖学术机构,致力于推进机器学习和人工智能标准及衡量指标。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。