尽管自己的下一代GPU芯片要到明年才会推出,但在本周开幕的GPU Technology Conference(GTC)大会上,Nvidia把重点放在了一系列新设备和新服务上,旨在巩固自身芯片在计算机图形、数据科学和人工智能等领域的领先地位。
本周在美国圣克拉拉举行的年度GTC大会上,Nvidia推出了旨在加速数据科学的工作站新产品,以及基于RTX实时光线追踪技术的服务器新产品。RTX是Nvidia去年底推出的一项技术,用于提供电影级质量的图像,以制作视频游戏、虚拟现实和增强现实。
这次新推出的数据科学工作站系列产品将由Nvidia主要的计算机合作伙伴厂商供货,例如Dell Technologies以及联想集团。Nvidia联合创始人、首席执行官黄仁勋在周一下午的GTC大会主题演讲中吹嘘说,“我们正在整个企业数据科学团队浓缩到一个小盒子里”。
Nvidia还表示,Nvidia很快就将通过Nvidia云向客户提供最顶级的、面向人工智能的数据中心服务器芯片T4,而且还将通过AWS G4新计算实例提供。此外,思科、Dell EMC、富士通、HPE、浪潮、联想和曙光等厂商的服务器系统也将支持T4芯片。该芯片专为机器学习和深度学习打造,近年来,这两个人工智能的分支已经在语音识别、图像识别、自动驾驶汽车方面取得了巨大的进步。
特别是T4芯片还瞄准了AI推理工作负载,这种工作负载是运行神经网络模型的计算密集型负载,需要用大量数据进行训练。Nvidia副总裁、加速计算部门总经理Ian Buck表示,在云中使用T4,已经被用于帮助PayPal实时处理付款过程,同时将欺诈行为减少10%,也帮助Snap进行实时处理照片捕捉,以及提高广告效率。
Nvidia首席科学家、研究主管Bill Dally在接受采访时表示,T4在人工智能推理方面仍然远远领先于竞争对手,甚至超过了数十家芯片制造商所生产的专用AI芯片。“很多初创公司可能要让他们的风险投资方们失望了,”他说。
无论如何,随着这些AI模型被用于各种服务中,未来几年,人工智能推理的增速要远远快于人工智能训练。
Moor Insights&Strategy分析师Karl Freund认为:“推理加速仍然是一个小众市场,但会实现大幅的增长,在未来五年超过人工智能训练市场。在T4问世之前,Nvidia从来没有一款专门为推理任务设计的芯片,所以这是Nvidia在推动采用、用于本地环境以及云中迈出的重要一步。”
Nvidia还推出了一款名为CUDA-X的统一加速计算服务库。目前,AWS正在自己的SageMaker机器学习云服务中使用CUDA-X,此外微软、Databricks等公司也在使用中。这款免费产品还将通过软件容器提供给客户,使其可以在多个计算硬件和平台之上使用。
黄仁勋表示:“加速计算不仅仅关乎于芯片,一个计算机的成功是与围绕它的生态系统有关的。”
Nvidia还面向人工智能提供了一些专用的工具包,例如今天Nvidia推出了可以辅助放射学的Clara AI。
Nvidia还重点推出了为世界各地从自动驾驶汽车、机器人到网络边缘的其他设备所打造的新产品和服务。
在自动驾驶汽车方面,Nvidia宣布了一款基于云的DRIVE Constellation自动驾驶汽车仿真平台。Nvidia表示,该平台在从常规驾驶、到非常罕见和非常危险的各种虚拟场景中驾驶数百万英里,比在现实世界中的驾驶效率更高。这款平台是在去年GTC大会上公布的,采用了两台服务器,一台是作为模拟器,另一台配置了Nvidia的DRIVE AGX Pegasus AI驱动型汽车计算机,用于处理模拟的传感器数据。
此外,Nvidia还公布了DRIVE AV自动驾驶汽车软件套件的Safety Force Field驾驶政策,该套件可以预测驾驶环境中的各种变化,并采取保护汽车和路上行人的最佳措施,旨在确保各项操作不会造成不安全的情况。
Nvidia自动驾驶软件副总裁David Nister表示,Safety Force Field是“以数学方式进行设计的,这样配备了SFF的自动驾驶车辆就会像磁铁一样相互排斥,确保自身不受伤害,不会造成危险的情况。此外,它还可以与任何驾驶软件结合使用”。
Nvidia表示,已经与Toyota Research Institute-Advanced Development签署协议,合作开发、训练和验证自动驾驶型汽车,它也是将是首个采用Constellation的第一家公司。
Nvidia还在今年的GTC大会上宣布推出了Jetson Nano,加强对边缘设备的服务。Jetson Nano是一台小型计算机,只需5瓦功率就能运行人工智能工作负载。
Jetson Nano有两个版本,一个是面向开发者的版本,价格为99美元,另一个是面向企业的生产就绪型版本,价格为129美元,旨在让普通人更容易构建机器人、数字助理和自动化设备等人工智能项目。Dally说,从本质上说,Jeston Nano是要成为AI版的Raspberry Pi。
最近几个季度Nvidia一直深陷困境,因为随着比特币和其他替代货币的价格不断下滑,市场对于用于加密货币挖矿使用的Nvidia芯片需求量也在不断缩减。不过大多数分析师认为,这个问题只是暂时性的,Nvidia不仅可以利用在游戏这一核心业务方面的增长,而且还有数据科学和人工智能等高速增长的新兴市场——因此,今年的GTC大会就把重点放在了后两者上。
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。