NVIDIA Turing GPU与 NVIDIA Xavier在MLPerf数据中心与边缘AI推理性能基准测试中取得最快成绩
加利福尼亚州圣克拉拉市——2019年11月6日——NVIDIA于今日公布,其在最新测定数据中心与边缘AI推理工作负载性能的基准测试中取得最快成绩。NVIDIA在前不久的AI训练基准测试中也展现出同样强大的实力,为此次获胜奠定了基础。
MLPerf Inference 0.5是业内首个独立AI推理基测套件,其测试结果证明了NVIDIA Turing数据中心GPU以及NVIDIA Xavier边缘计算芯片系统的性能。
MLPerf的五项推理基准适用于一系列形式因素和四种推理场景,涵盖了图像分类、目标检测和翻译等已有的AI应用。
凭借Turing GPU所提供的目前市面上单处理器最高的性能,NVIDIA在全部五项针对于两种数据中心关注的场景(服务器和离线)的基准测试中均排在首位。Xavier则是市面上针对两种边缘场景(单流和多流)性能最高的边缘和移动芯片系统。
NVIDIA副总裁兼加速计算总经理Ian Buck表示:“AI正处于从研究阶段迅速转向大规模实际应用部署的临界点。AI推理是一项巨大的计算挑战。NVIDIA将业内最先进的可编程加速器CUDA-X AI算法套件与我们在AI计算领域的深厚知识相结合,能够帮助数据中心部署庞大且正在不断增长的复杂AI模型。”
由于重视其计算平台在各种AI工作负载中的可编程性与性能,因此NVIDIA是唯一一家提交了全部五项MLPerf基准测试结果的AI计算平台公司。此前七月,NVIDIA就曾在多项MLPerf 0.6 AI训练基准测试结果中胜出,在训练性能方面创造了八项纪录。
NVIDIA GPU在全球最大的云基础设施中为大型推理工作负载提供加速,这些云基础设施包括阿里云、AWS、谷歌云平台、微软Azure和腾讯等。目前,AI正在朝操作和数据生成点的边缘移动。沃尔玛、宝洁等全球首屈一指的企业和机构正使用NVIDIA EGX边缘计算平台与AI推理能力在边缘运行复杂的AI工作负载。
NVIDIA的所有MLPerf测试结果均采用NVIDIA TensorRT 6高性能深度学习推理软件获得。该软件能够在生产中轻松优化和部署数据中心、边缘等位置的AI应用。此外,GitHub库还以开源形式提供新的TensorRT优化。
为了扩展其推理平台,NVIDIA于今日宣布推出了Jetson Xavier NX。Jetson Xavier NX是全球体积最小、性能最强大的适用于边缘机器人和嵌入式计算设备的AI超级计算机,它是围绕MLPerf Inference 0.5基准测试中所使用的Xavier芯片系统所打造的低功耗版本。
好文章,需要你的鼓励
Gartner预测,到2030年所有IT工作都将涉及AI技术的使用,这与目前81%的IT工作不使用AI形成鲜明对比。届时25%的IT工作将完全由机器人执行,75%由人类在AI辅助下完成。尽管AI将取代部分入门级IT职位,但Gartner认为不会出现大规模失业潮,目前仅1%的失业由AI造成。研究显示65%的公司在AI投资上亏损,而世界经济论坛预计AI到2030年创造的就业机会将比消除的多7800万个。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
人工智能正从软件故事转向AI工厂基础,芯片、数据管道和网络协同工作形成数字化生产系统。这种新兴模式重新定义了性能衡量标准和跨行业价值创造方式。AI工厂将定制半导体、低延迟结构和大规模数据仪器整合为实时反馈循环,产生竞争优势。博通、英伟达和IBM正在引领这一转变,通过长期定制芯片合同和企业遥测技术,将传统体验转化为活跃的数字生态系统。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。