MLPerf是业界公认的AI性能衡量基准,涵盖计算机视觉、医学影像、推荐系统、语音识别和自然语言处理等一系列工作负载。
随着人工智能在各行各业的深入落地,MLPerf测试成绩成为企业进行AI部署的一项重要参考工具,能够助力其在IT基础设施投资方面做出明智的决策。
近日,NVIDIA宣布其AI推理平台在最新MLPerf基准测试所有类别中展现出的性能均创下纪录。
刷新AI推理纪录
NVIDIA是MLPerf测试的常客,去年7月,NVIDIA打破MLPerf基准测试16项AI性能纪录;去年10月,NVIDIA创下了数据中心与边缘计算系统全部六个应用领域的记录。
步入2021年,NVIDIA依然保持了强劲的势头。在本次MLPerf测试中,NVIDIA是唯一一家针对数据中心和边缘类别中的每项测试都提交结果的公司,在所有MLPerf工作负载中均展现出顶级的性能。


多项提交结果还基于Triton推理服务器,其支持来自所有主要框架的模型,可在GPU及CPU上运行,并针对批处理、实时和串流传输等不同的查询类型进行了优化,可简化在应用中部署AI的复杂性。在配置相当的情况下,采用Triton的提交结果所达到的性能接近于最优化的GPU实现及CPU实现能够达到的性能。
NVIDIA能够取得如此佳绩,得益于NVIDIA AI平台的广度,其包含多种类型的GPU和AI软件,包括TensorRT和NVIDIA Triton推理服务器——微软、Pinterest、Postmates、T-Mobile、USPS和微信等领先企业都部署了该平台。

同时,NVIDIA还开创性地使用NVIDIA Ampere架构的多实例GPU性能,在单一GPU上使用7个MIG实例,同时运行所有7项MLPerf离线测试。该配置实现了与单一MIG实例独立运行几乎完全相同的性能。

这些提交结果展示了MIG的性能和通用性,能够针对特定应用,配置适当数量的GPU计算,从而让每个数据中心GPU都能发挥最大的效用。
除NVIDIA公司提交的测试结果外,多家NVIDIA合作伙伴也提交了共360多项基于NVIDIA GPU的测试结果,包括阿里云、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想和超微。
实现AI普及化
此次MLPerf是NVIDIA A30和A10 GPU的首次亮相。两款GPU集高性能与低功耗于一身,可成为企业在AI推理、训练、图形和传统企业级计算工作负载等诸多方面的主流选择。
在打造全球领先的AI性能的同时,这一AI推理平台通过NVIDIA A30和A10 GPU对主流服务器实现了全新的扩展,让AI普及化。据悉,思科、戴尔科技、慧与、浪潮和联想预计将从今年夏季开始将这两款GPU集成到其最高容量的服务器中。

NVIDIA A30和A10 GPU是NVIDIA AI平台中的最新成员。NVIDIA AI平台包括NVIDIA Ampere架构GPU、NVIDIA Jetson AGX Xavier、Jetson Xavier NX,以及经优化后能够实现AI加速的全栈NVIDIA软件。
当前计算多元化趋势明显,AI应用引入了新的计算类型,从推理到训练,跨度更大,同时,数据量也从GB级到TB级、PB级不断提升,类型从结构化到半结构化、非结构化更加复杂多样。
不同数值精度的计算类型对于计算芯片指令集、架构的要求是不一样的,这样就导致之前我们一直使用的通用CPU已经无法满足多元化计算场景要求,这也是计算芯片的种类越来越多的很重要的原因。
而在NVIDIA GTC 2021上,围绕CPU、GPU和DPU这三类芯片,NVIDIA发布了全球首款专为TB级加速计算而设计的CPU NVIDIA Grace、全新BlueField-3 DPU等硬件产品,持续推动AI民主化。
在软件方面,超大规模语言模型训练与推理问答引擎Megatron、实时对话式AI平台Jarvis、AI网络安全框架Morpheus、由GPU加速的量子电路模拟框架CuQuantum等一系列最新进展也首次揭晓。
显然,面对AI浪潮,NVIDIA不断优化软硬件产品组合,为AI的落地提供源源不断的动力。
好文章,需要你的鼓励
大多数用户只使用计算机预装的操作系统直到报废,很少尝试更换系统。即使使用较老版本的Windows或macOS,用户仍可通过开源软件获益。本文建议通过重新安装系统来提升性能,Mac用户可从苹果官方下载各版本系统安装包,PC用户则建议使用纯净版Windows 10 LTSC以获得更长支持周期。文章强调备份数据的重要性,并推荐升级内存和固态硬盘。对于老旧系统,应替换需要联网的内置应用以降低安全风险,定期进行系统维护清理。
新加坡南洋理工大学研究团队提出"棱镜假设",认为图像可像光谱一样分解为不同频率成分,低频承载语义信息,高频包含视觉细节。基于此开发的统一自编码系统UAE,通过频率域分解成功统一了图像理解和生成能力,在多项基准测试中超越现有方法,为构建真正统一的视觉AI系统提供了新思路,有望推动计算机视觉技术向更智能统一的方向发展。
微软杰出工程师Galen Hunt在LinkedIn上宣布,目标是到2030年消除微软所有C和C++代码。公司正结合AI和算法重写最大的代码库,目标是"1名工程师、1个月、100万行代码"。微软已构建强大的代码处理基础设施,利用AI代理和算法指导进行大规模代码修改。该项目旨在将微软最大的C和C++系统翻译为内存安全的Rust语言,以提高软件安全性并消除技术债务。
芝加哥伊利诺伊大学团队提出QuCo-RAG技术,通过检查AI训练数据统计信息而非内部信号来检测AI回答可靠性。该方法采用两阶段验证:预检查问题实体频率,运行时验证事实关联。实验显示准确率提升5-14个百分点,在多个模型上表现稳定,为AI可靠性检测提供了客观可验证的新方案。