NVIDIA Turing GPU与 NVIDIA Xavier在MLPerf数据中心与边缘AI推理性能基准测试中取得最快成绩
加利福尼亚州圣克拉拉市——2019年11月6日——NVIDIA于今日公布,其在最新测定数据中心与边缘AI推理工作负载性能的基准测试中取得最快成绩。NVIDIA在前不久的AI训练基准测试中也展现出同样强大的实力,为此次获胜奠定了基础。
MLPerf Inference 0.5是业内首个独立AI推理基测套件,其测试结果证明了NVIDIA Turing数据中心GPU以及NVIDIA Xavier边缘计算芯片系统的性能。
MLPerf的五项推理基准适用于一系列形式因素和四种推理场景,涵盖了图像分类、目标检测和翻译等已有的AI应用。
凭借Turing GPU所提供的目前市面上单处理器最高的性能,NVIDIA在全部五项针对于两种数据中心关注的场景(服务器和离线)的基准测试中均排在首位。Xavier则是市面上针对两种边缘场景(单流和多流)性能最高的边缘和移动芯片系统。
NVIDIA副总裁兼加速计算总经理Ian Buck表示:“AI正处于从研究阶段迅速转向大规模实际应用部署的临界点。AI推理是一项巨大的计算挑战。NVIDIA将业内最先进的可编程加速器CUDA-X AI算法套件与我们在AI计算领域的深厚知识相结合,能够帮助数据中心部署庞大且正在不断增长的复杂AI模型。”
由于重视其计算平台在各种AI工作负载中的可编程性与性能,因此NVIDIA是唯一一家提交了全部五项MLPerf基准测试结果的AI计算平台公司。此前七月,NVIDIA就曾在多项MLPerf 0.6 AI训练基准测试结果中胜出,在训练性能方面创造了八项纪录。
NVIDIA GPU在全球最大的云基础设施中为大型推理工作负载提供加速,这些云基础设施包括阿里云、AWS、谷歌云平台、微软Azure和腾讯等。目前,AI正在朝操作和数据生成点的边缘移动。沃尔玛、宝洁等全球首屈一指的企业和机构正使用NVIDIA EGX边缘计算平台与AI推理能力在边缘运行复杂的AI工作负载。
NVIDIA的所有MLPerf测试结果均采用NVIDIA TensorRT 6高性能深度学习推理软件获得。该软件能够在生产中轻松优化和部署数据中心、边缘等位置的AI应用。此外,GitHub库还以开源形式提供新的TensorRT优化。
为了扩展其推理平台,NVIDIA于今日宣布推出了Jetson Xavier NX。Jetson Xavier NX是全球体积最小、性能最强大的适用于边缘机器人和嵌入式计算设备的AI超级计算机,它是围绕MLPerf Inference 0.5基准测试中所使用的Xavier芯片系统所打造的低功耗版本。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。