多年来,NVIDIA 在数据中心 AI 加速器和 PC 图形领域一直处于领先地位。当公司在今年拉斯维加斯的 CES 展会上宣布即将推出基于 Blackwell GPU 架构的 GeForce RTX 50 系列显卡时,几乎没有人怀疑 NVIDIA 会在本月晚些时候向玩家发货时推出市场上最强大的产品。然而,有关新款 GeForce RTX 5090 的详细信息和性能细节,直到今天的禁运解除才得以揭晓。
那么,事不宜迟,让我们来看看 NVIDIA 为 PC 游戏玩家、爱好者和创作者推出的新款 GeForce RTX 5090 Founders Edition 显卡,然后深入了解其功能和预期表现。
GeForce RTX 5090 的内部构造:NVIDIA 的 RTX Blackwell 架构
我们不会深入技术细节,但可以肯定地说,Nvidia 从零开始构建了其 RTX Blackwell GPU 架构,以支持高级渲染技术,如具有帧生成和神经着色器的深度学习超级采样,这些技术利用 AI 提升着色器的视觉效果和性能。此外,Blackwell 的第四代光线追踪核心也能够更高效地处理大型几何体和标准几何体,同时其第五代 Tensor 核心现在支持 FP4 精度,使 DLSS 4 和 AI 工作负载的吞吐量提高一倍。
在 Blackwell 中,着色器执行重新排序的性能提高了多达两倍,Nvidia 的新 GPU 架构还配备了一个新的内存控制器,与 32GB 的 GDDR7 内存结合使用时,提供了 GDDR6 的两倍带宽,最高可达 1.8TBps(对于 RTX 5090),同时提高了功率效率。最后,虽然我的简短列表并不详尽,但 Nvidia 的 RTX Blackwell 架构的不同模块可以进入更深的睡眠状态,并比公司上一代 Ada 架构更快地从这些睡眠状态中唤醒,具有先进的时钟门控、功率门控和电压轨道门控。实际上,Blackwell 的整个时钟树可以在 GPU 仍然活跃的情况下禁用,因此如果板上的其他部分(如内存)处于空闲状态,可以节省额外的电力。这些只是 RTX Blackwell 的一些进步,但如果您想要更深入的了解,请访问我的同事 Marco 在 HotHardware 的报道,获取完整信息。
AI 增强和生成的帧是未来的发展方向,请加入其中
在游戏社区中,这个话题引起了很多讨论,所以让我们直接面对它。Nvidia 对其 GeForce RTX 50 系列 GPU 做出了一些大胆的性能声明,CEO 黄仁勋将其新的 549 美元 GeForce RTX 5070 与公司上一代旗舰产品 1599 美元的 GeForce RTX 4090 相提并论,指出它们提供了类似的性能。这里的附加条件是,新的 RTX 5070 将通过不仅在其芯片架构中启用的高级技术,还通过新的 AI 渲染技术(如具有多帧生成的 DLSS 4)提供这种级别的性能。
简而言之,Nvidia 的上一代 DLSS 3 技术可以在游戏引擎中渲染单个 AI 生成的帧,但现在通过 DLSS 4,神经网络可以在传统渲染的真实帧之间生成多达 3 个额外的帧。结合 Blackwell 上的高级显示引擎帧节奏,这为支持 DLSS 4 的 GeForce RTX 50 系列提供了巨大的性能提升,相对于旧版 GeForce RTX 40 硬件上的单帧生成。当然,纯粹主义者会争论“假帧”和在游戏中与如此多的 AI 生成帧交互的固有延迟。尽管 Nvidia 的新 Reflex 2 技术旨在减轻帧到反应的延迟,但游戏开发者必须在其游戏引擎中支持 DLSS 4 和 Reflex 2。
在发布时,Nvidia 迅速指出,市场上有 75 款游戏将支持具有多帧生成的 DLSS 4,并且随着时间的推移,这个列表将会增长,就像现在支持以前版本的 DLSS 的数百个游戏一样。然而,再次,社区中的一些负面纯粹主义者会争论说,没有什么能替代传统渲染中的强大计算能力。这在表面上是正确的,但问题是,随着具有光线追踪和其他高级渲染效果的游戏引擎变得更加复杂和计算密集,仅仅依靠硬件来解决问题,而不通过 AI 和其他算法方法来推进渲染技术,很快就会达到收益递减的临界点。
事实上,与所有主要的 PC 图形公司(AMD、NVIDIA 和 Intel)的对话中,所有公司都指出 AI 辅助帧生成的未来是前进的方向。因此,这不是一个“是否”的问题,而是游戏开发者和整个游戏社区何时加入的问题。
GeForce RTX 5090 的高层次性能概况
从三个高层次的角度来看,Nvidia 新款 GeForce RTX 5090 的性能可以被清晰地分解——传统的光栅性能、超分辨率和帧生成的性能,以及非游戏应用中的 AI 推理和生成式 AI 性能,以及内容创作。
就内容创作而言,我在视频渲染中使用 GeForce RTX 5090 的经验是最终渲染的转码时间显著减少。这是由于 GeForce RTX 5090 板载的额外编码器;RTX 4090 有两个编码器,而 RTX Blackwell 5090 有三个支持 Nvidia 第九代 NVENC 的编码器。说到这里,让我们快速检查一下 AI 吞吐量。
ML Commons 最近发布了广受尊敬的 MLPerf AI 基准测试的 PC 客户端版本。在这里,我们看到 GeForce RTX 5090 比上一代 4090 同类产品快了 38% 以上。我还要指出,除了这个 Token 吞吐量的提升外,首次 Token 延迟时间也减少了约 25%。
接下来,让我们深入了解最前沿的游戏性能,从广受欢迎的动作 RPG 游戏《赛博朋克 2077》的超高画质预设开始。
在这里,我们看到 GeForce RTX 5090 Blackwell 的全部威力,最长的条形图代表其在游戏中以 4X 帧生成设置的最快 DLSS 4 渲染帧率。此设置实际上渲染了三个 AI 生成的帧以及一个单独的放大帧,以最大化性能。如果我们比较 RTX 4090 的最快设置,即具有单 AI 帧生成的 DLSS,我们看到 RTX 5090 的性能提升超过 65%,几乎是没有帧生成的上一代 GeForce RTX 4090 性能的三倍。查看完全关闭帧生成的性能,RTX 5090 比 4090 快 22% 以上。而 AMD 当前最快的 Radeon GPU 在启用 FSR 3 超分辨率(不包括帧生成,这在此游戏标题中不可用于 Radeon)时甚至无法参与竞争。
一级方程式赛车模拟游戏 F1 24 显示了 GeForce RTX 5090 与上一代 RTX 4090 的性能差距较小,启用帧生成时提升约 37%,而没有 AI 帧生成时则提升 24%。该游戏标题还展示了 AMD Radeon RX 7900 XTX 的最佳表现,因为 F1 24 支持 AMD 流体运动帧生成技术,使 Radeon 能够显著提升位置,但仍无法与 RTX 5090 相匹敌。
最后,再次以现代、华丽且图形丰富的游戏标题《黑神话:悟空》结束,在其电影画质预设下,所有 GPU 竞争者都面临压力。在这里,新款 GeForce RTX 5090 在相似设置下启用帧生成时比 RTX 4090 快约 33%,而如果关闭帧生成,差距缩小到约 28% 的优势。即使启用帧生成,市场上最快的 Radeon 显卡在此游戏标题中的这些设置下也无法达到可玩帧率。
NVIDIA GeForce RTX 50 发布的关键要点和未来展望
可以说,Nvidia 的新款 GeForce RTX 50 系列引发了一些争议,但更多的是关于价格方面的争议,RTX 5090 的价格上涨了 25%,为 1999 美元,而 GeForce RTX 4090 在发布时的零售价为 1599 美元。毫无疑问,2000 美元的显卡对于许多玩家来说实在太贵了,但当你拥有市场上最强大、功能最丰富的产品,并且开发它需要进行严肃的工程投资时,你可以为该产品定价,而你的主要竞争对手则无法做到。这就是这么简单。
不过,如果你只关注 GeForce RTX 5090 Founders Edition 的价格,我认为你错过了重点。Nvidia 对 GeForce RTX Blackwell 的工程投资也将在更低、更主流的价格点上获得回报。
最终,这就是关键所在。社区中的人们将辩论 Nvidia 昂贵的新顶级显卡的优点,但你无法否认 RTX Blackwell 带来的高级渲染技术的优点,以及它们所实现的性能和视觉保真度。当 Nvidia CEO 黄仁勋指出公司即将推出的 549 美元 GeForce RTX 5070 将与上一代顶级 GeForce RTX 4090 一样快时,他是有意强调公司在这系列 PC 显卡、开发者工具和软件中实现的 AI 辅助渲染技术的优点。
通过 AI 生成内容推进 PC 图形是一种自然的演变,也是整个行业的发展方向,不仅仅是 Nvidia。然而,Nvidia 也再次处于 GPU 架构的前沿,拥有开辟这一创新新道路所需的工程和软件支持。新款 GeForce RTX 5090 是目前市面上最快的 PC 显卡,彰显了公司在其多年前创立的产品类别和技术中的主导地位。
好文章,需要你的鼓励
随着生成式 AI 模型的爆炸性增长,单一数据中心已难以满足其计算需求。未来,AI 的持续发展可能依赖于跨越国家甚至大洲的新型超级计算机。这种分布式架构将现有数据中心连接起来,形成一个大型虚拟数据中心,以应对 AI 模型日益增长的计算和能源需求。
本文探讨了人工智能领域的最新模型进展,特别是o1-pro模型带来的突破。文章解释了新模型如何改变工程师与大语言模型交互的方式,提高了模型处理复杂任务的能力。同时介绍了业内专家对这些进展的看法,以及这些变化对AI技术发展的潜在影响。
KKR计划收购中东最大数据中心公司之一Gulf Data Hub的股份,双方将投入50亿美元用于公司的区域和国际扩张。这笔投资反映了中东地区作为全球资金投资热点的崛起,以及数字基础设施需求的激增。KKR看好数据中心支持人工智能和云计算的巨大潜力。
人工智能在教育领域的应用正在迅速发展。一项针对尼日利亚学生的研究表明,使用 AI 辅导仅 6 周就能带来相当于 2 年的学习进步。AI 导师能够提供个性化指导、认知支持和情感鼓励,特别有助于帮助学习落后的学生。这种技术有望实现规模化的高质量教学,为每个学生提供类似亚里士多德般的个性化辅导。