尽管自己的下一代GPU芯片要到明年才会推出,但在本周开幕的GPU Technology Conference(GTC)大会上,Nvidia把重点放在了一系列新设备和新服务上,旨在巩固自身芯片在计算机图形、数据科学和人工智能等领域的领先地位。
本周在美国圣克拉拉举行的年度GTC大会上,Nvidia推出了旨在加速数据科学的工作站新产品,以及基于RTX实时光线追踪技术的服务器新产品。RTX是Nvidia去年底推出的一项技术,用于提供电影级质量的图像,以制作视频游戏、虚拟现实和增强现实。
这次新推出的数据科学工作站系列产品将由Nvidia主要的计算机合作伙伴厂商供货,例如Dell Technologies以及联想集团。Nvidia联合创始人、首席执行官黄仁勋在周一下午的GTC大会主题演讲中吹嘘说,“我们正在整个企业数据科学团队浓缩到一个小盒子里”。
Nvidia还表示,Nvidia很快就将通过Nvidia云向客户提供最顶级的、面向人工智能的数据中心服务器芯片T4,而且还将通过AWS G4新计算实例提供。此外,思科、Dell EMC、富士通、HPE、浪潮、联想和曙光等厂商的服务器系统也将支持T4芯片。该芯片专为机器学习和深度学习打造,近年来,这两个人工智能的分支已经在语音识别、图像识别、自动驾驶汽车方面取得了巨大的进步。
特别是T4芯片还瞄准了AI推理工作负载,这种工作负载是运行神经网络模型的计算密集型负载,需要用大量数据进行训练。Nvidia副总裁、加速计算部门总经理Ian Buck表示,在云中使用T4,已经被用于帮助PayPal实时处理付款过程,同时将欺诈行为减少10%,也帮助Snap进行实时处理照片捕捉,以及提高广告效率。
Nvidia首席科学家、研究主管Bill Dally在接受采访时表示,T4在人工智能推理方面仍然远远领先于竞争对手,甚至超过了数十家芯片制造商所生产的专用AI芯片。“很多初创公司可能要让他们的风险投资方们失望了,”他说。
无论如何,随着这些AI模型被用于各种服务中,未来几年,人工智能推理的增速要远远快于人工智能训练。
Moor Insights&Strategy分析师Karl Freund认为:“推理加速仍然是一个小众市场,但会实现大幅的增长,在未来五年超过人工智能训练市场。在T4问世之前,Nvidia从来没有一款专门为推理任务设计的芯片,所以这是Nvidia在推动采用、用于本地环境以及云中迈出的重要一步。”
Nvidia还推出了一款名为CUDA-X的统一加速计算服务库。目前,AWS正在自己的SageMaker机器学习云服务中使用CUDA-X,此外微软、Databricks等公司也在使用中。这款免费产品还将通过软件容器提供给客户,使其可以在多个计算硬件和平台之上使用。
黄仁勋表示:“加速计算不仅仅关乎于芯片,一个计算机的成功是与围绕它的生态系统有关的。”
Nvidia还面向人工智能提供了一些专用的工具包,例如今天Nvidia推出了可以辅助放射学的Clara AI。
Nvidia还重点推出了为世界各地从自动驾驶汽车、机器人到网络边缘的其他设备所打造的新产品和服务。
在自动驾驶汽车方面,Nvidia宣布了一款基于云的DRIVE Constellation自动驾驶汽车仿真平台。Nvidia表示,该平台在从常规驾驶、到非常罕见和非常危险的各种虚拟场景中驾驶数百万英里,比在现实世界中的驾驶效率更高。这款平台是在去年GTC大会上公布的,采用了两台服务器,一台是作为模拟器,另一台配置了Nvidia的DRIVE AGX Pegasus AI驱动型汽车计算机,用于处理模拟的传感器数据。
此外,Nvidia还公布了DRIVE AV自动驾驶汽车软件套件的Safety Force Field驾驶政策,该套件可以预测驾驶环境中的各种变化,并采取保护汽车和路上行人的最佳措施,旨在确保各项操作不会造成不安全的情况。
Nvidia自动驾驶软件副总裁David Nister表示,Safety Force Field是“以数学方式进行设计的,这样配备了SFF的自动驾驶车辆就会像磁铁一样相互排斥,确保自身不受伤害,不会造成危险的情况。此外,它还可以与任何驾驶软件结合使用”。
Nvidia表示,已经与Toyota Research Institute-Advanced Development签署协议,合作开发、训练和验证自动驾驶型汽车,它也是将是首个采用Constellation的第一家公司。
Nvidia还在今年的GTC大会上宣布推出了Jetson Nano,加强对边缘设备的服务。Jetson Nano是一台小型计算机,只需5瓦功率就能运行人工智能工作负载。
Jetson Nano有两个版本,一个是面向开发者的版本,价格为99美元,另一个是面向企业的生产就绪型版本,价格为129美元,旨在让普通人更容易构建机器人、数字助理和自动化设备等人工智能项目。Dally说,从本质上说,Jeston Nano是要成为AI版的Raspberry Pi。
最近几个季度Nvidia一直深陷困境,因为随着比特币和其他替代货币的价格不断下滑,市场对于用于加密货币挖矿使用的Nvidia芯片需求量也在不断缩减。不过大多数分析师认为,这个问题只是暂时性的,Nvidia不仅可以利用在游戏这一核心业务方面的增长,而且还有数据科学和人工智能等高速增长的新兴市场——因此,今年的GTC大会就把重点放在了后两者上。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。