自从AMD搭载缓存堆叠技术的Ryzen 7 5800X3D在游戏性能上追平英特尔以来,玩家们就一直在想:如果一块V-Cache芯粒已经足够强大,那两块岂不是更好?随着Ryzen 9 9950X3D2双版本(DE)的正式发布,我们终于得到了答案。
这款处理器将16个Zen 5核心与208 MB系统缓存集成于单个AM5插槽中,堪称AMD迄今为止真正意义上的旗舰级CPU。它所处的定位与英特尔KS系列发烧友处理器颇为相似,在任何工作负载下均能提供毫无妥协的性能表现。
这款旗舰处理器在我们的测试榜单中位居榜首,但考虑到高达899美元的官方售价,其性能提升幅度或许不及预期。它所带来的性能增益,代价相当高昂。
目前,英特尔在这一性能档位上尚无可与之匹敌的产品,因此AMD实际上是在与自己竞争。然而——剧透预警——在游戏性能方面,9950X3D2-DE相较于售价更为亲民的Ryzen 7 9850X3D并无任何优势。而在生产力工作负载方面,我们的测试数据显示,额外的缓存相比售价低200美元的单V-Cache 9950X3D,仅带来了3%到9%的性能提升。
不过,旗舰产品向来性价比欠佳,这几乎是这类处理器的宿命。
产品规格与技术解析
9950X3D2-DE的核心卖点在于其庞大的208 MB总系统缓存。更大的缓存能让工作负载在处理器上驻留更长时间、降低访问延迟,并在数据密集型任务中全面提升性能表现。
AMD早在2022年初就开始借助台积电先进封装技术,将其称为3D V-Cache的SRAM芯片粘贴至计算芯粒上,最早应用于Ryzen 7 5800X3D和面向HPC领域的Milan-X EPYC系列处理器。
然而,在此之前,无论用户选择的是8核Ryzen 7还是16核Ryzen 9,AMD消费级平台始终只配备一块V-Cache芯粒。
在9950X3D2-DE中,这款16核处理器的每个核心复合体芯粒(CCD)均配备了一块64 MB SRAM芯片,将总L3缓存提升至192 MB——其中64 MB集成于CCD内部,另有128 MB的V-Cache位于其下方。
这一配置使该处理器相比标准版9950X3D多出64 MB缓存,但代价是最高睿频频率略有下降,以及更高的热设计功耗(TDP)。
由此可见,Ryzen 9 9950X3D2-DE本质上就是一款搭载了两块V-Cache芯粒的9950X3D,这意味着其I/O芯片上的内存控制器维持不变。
官方而言,AMD 9000系列处理器支持最高5600 MT/s的JEDEC标准内存速率。不过,DDR5 6000 MT/s仍是这类处理器的推荐配置,因为它可以在内存时钟与控制器之间实现更紧凑的1:1比率。AMD表示,DDR5 8000 MT/s内存在X870平台上应该相对容易运行。遗憾的是,我们暂时还没有机会对此进行测试。况且,32 GB的DDR5 8000套件零售价高达500至800美元,或许还需要等待一段时间。
据AMD称,用户在生产力工作负载中可期待获得5%到13%的性能提升,游戏性能则与9950X3D持平。从我们的测试结果来看,该处理器基本兑现了这一承诺。
测试平台配置
AMD为我们提供了Ryzen 9 9950X3D2双版本处理器、32 GB DDR5 6000 MT/s内存,以及一块高端ASRock X870E Taichi主板用于本次评测。
此外还提供了NZXT 360 mm一体式水冷散热器和1 TB三星9100 Pro固态硬盘,但为保持测试一致性,我们选择继续使用自有的990 Evo Plus固态硬盘和Arctic Liquid Freezer 3一体式水冷。未来测试将采用PCIe 5.0存储设备。
所有基准测试均在主板默认设置下运行,并启用了EXPO 1内存超频配置文件。
如前所述,AMD此次旗舰产品的最大对手其实是自己。为了找出9950X3D2-DE相对于其他X3D系列产品的优劣势,AMD还为我们提供了标准版Ryzen 9 9950X3D和新近发布的Ryzen 7 9850X3D供对比测试。
我们的测试阵容还包括AMD 12核Ryzen 9 9900X、8核Ryzen 7 7800X3D,以及英特尔性价比出色的酷睿Ultra 200 Plus系列处理器。
英特尔最新处理器的售价定位截然不同,酷睿Ultra 5 250K官方售价为200美元,酷睿Ultra 7 270K为300美元。尽管如此,凭借更高的核心数量和对DDR5 7200 MT/s更快内存的支持,这些处理器在生产力基准测试中表现相当出色。
在游戏基准测试中,我们使用了Nvidia RTX 6000 Ada显卡。这款48 GB专业显卡的选择或许有些出人意料,但它拥有比RTX 4090多10%的CUDA核心,是我们目前手头最强、最不可能成为性能瓶颈的GPU。
频率与功耗表现
在深入探讨生产力和游戏性能之前,我们先运行了几项合成基准测试,以了解处理器的睿频算法和功耗特性。
从技术规格看,Ryzen 9 9950X3D2-DE的最高睿频比非双版本低100 MHz,在最优条件下可达5.6 GHz。但尽管睿频频率名义上更低,其TDP更高,这有助于在更长时间内维持较高的睿频频率。
在单线程性能测试中,双版本处理器毫无压力地达到并超越了其官方标注的睿频频率,在纯整数压力测试中超出了66 MHz,延续了AMD一贯低调承诺、超额兑现的核心频率传统。
不出意料,在AVX-512密集型Primesieve压力测试中,睿频频率有所回落,单核负载下最高约达5.55 GHz。即便是现代处理器,AVX等SIMD指令也出了名地耗电,在此条件下仅下降约100 MHz实属不易,与9000系列其他处理器的表现一致。
注:截至本文发布时,频率与功耗验证基准测试仅在Ubuntu 25.10桌面版上运行。这提供了一个干扰更少、可重复性更高的环境,但我们正在研究如何在未来于Windows系统上实现同等功能。本文其他所有测试均在Windows 11 25H2下进行,除非另有说明。
在全核整数负载下,Ryzen 9 9950X3D2-DE达到5.4 GHz,比9950X3D高出约30 MHz。进入AVX-512密集型Primesieve压力测试后,差距进一步拉大,双版本凭借更高TDP获得300 MHz优势,全核睿频突破4.7 GHz。
这一性能差距表明,AMD首款双V-Cache产品的提升不仅仅体现在缓存方面。
注:虽然我们在图表中提供了封装温度数据,但这些测试并非在温控环境中进行,这些数据点主要用于识别是否存在温度节流现象,所幸并未出现此问题。
9950X3D2-DE更高的持续睿频频率是以功耗增加为代价的。AMD官方标注9950X3D默认TDP为170 W,9950X3D2-DE为200 W。然而,官方TDP并不总与实际功耗相符,这一点在我们的测试中同样得到印证。
在全核整数负载下,9950X3D和双版本的封装功耗均在200至207瓦左右,后者略高。我们猜测,360 mm水冷排的散热效果足够好,使得AMD的睿频算法能够突破额定TDP运行。
有趣的情况出现在全核Primesieve负载测试中:9950X3D的封装功耗同样维持在约200瓦,而双版本处理器据S-TUI监控软件显示,功耗飙升至225瓦,这也解释了为何两款处理器在全核整数频率上差距不大,但双版本在SIMD压力测试中能达到更高的全核睿频。
内存带宽表现
更高的频率通常意味着更好的性能,但前提是内存速度足以为核心持续供给数据。尤其在计算流体动力学和机器学习等场景中,内存往往比算力更容易成为性能瓶颈。
在这方面,AMD的新旗舰表现有些喜忧参半。在我们使用的6000 MT/s内存条件下,AMD与支持7200 MT/s内存的英特尔相比处于下风,这并不意外。9950X3D2-DE实现了约72 GB/s(修正后)的内存带宽,而双通道平台理论上可以提供约94 GB/s。
注:Stream基准测试未考虑写入分配开销,为此应用了1.33倍的修正系数。我们在报告中同时提供了原始数据和修正后的数据。
谈及内存带宽,值得一提的是,得益于AMD的3D V-Cache芯片堆叠技术,工作负载不一定会因内存较慢而受到明显的性能影响,因为额外的缓存能够有效隐藏延迟。游戏是这方面最典型的例子,HPC和3D渲染任务同样在不同程度上受益于此。
合成基准测试结果
Geekbench 6测试中,9950X3D2-DE不出意外地以3562的单核分数和24393的多核分数领跑榜单,分别比英特尔270K领先4.4%至6.1%。与标准版9950X3D相比,AMD旗舰在此测试中快2.1%至6.4%。不过正如我们稍后将看到的,尽管Geekbench在评估单核性能方面颇具参考价值,但其多核得分在实际应用中并不总能反映真实性能。
Primesieve是我们常用的压力测试之一,因为它是少数几个能真正考验核心性能的工作负载。测试逻辑简单明了:计算一万亿以内的所有质数,结果以每秒百万个质数来衡量。该工作负载并行扩展性极佳,有助于观察处理器从单核到多核的扩展效率,同时充分利用AVX-512等SIMD指令。
在单核性能方面,9950X3D2-DE比其售价更低的单V-Cache同门并无太大优势,但在多核场景下,更高的TDP为其带来了7.5%的性能领先。
7-zip的LZMA压缩算法则呈现出不同的性能面貌。在此测试中,旗舰处理器以压倒性优势登顶,单线程性能比9950X3D高出18.9%,多线程性能高出3.9%。由于LZMA并非SIMD工作负载,我们有理由相信额外的64 MB L3缓存在此发挥了重要作用。
LZMA解压缩测试则呈现出略有不同的情况:9950X3D2-DE仍然领先,但优势微乎其微,与9950X3D的性能几乎持平。值得一提的是,英特尔300美元的酷睿Ultra 7 270K在此测试中与X3D系列非常接近,若以每美元MIPS为衡量标准,它无疑是最优选择。
网页应用性能测试中,我们采用Speedometer 3.1作为主要测试工具。凭借更大的缓存和更高的TDP,9950X3D2-DE在Firefox下比9950X3D高出8.9%;切换到Chrome后差距则明显缩小。当然,这些都是高端桌面处理器,浏览器的选择对性能的影响很可能大于CPU型号的选择。
实际应用性能测试
进入实际应用测试环节,HandBrake视频转码测试将一段10分钟4K 60帧H.264视频转换为1080p,使用x265编码器,中等预设,固定质量18。结果显示,9950X3D2-DE再次称霸榜首,比9950X3D快5.8%,比英特尔24核270K快11.5%。这一领先幅度虽可量化,但多花200美元购买第二块V-Cache芯片是否值得,仍令人存疑。英特尔200 Plus系列依然是CPU视频转码方面的性价比之王。
Blender测试渲染了Classroom、Monster和Junkshop三个测试场景,结果同样令人瞩目。Blender并行扩展性极佳,更多核心通常意味着更快的渲染速度。AMD旗舰再次登顶,Junkshop场景领先英特尔24核270K Plus达16.6%,Classroom场景领先13%;与9950X3D相比,则快出约6%至7%。
代码编译是另一项3D V-Cache缓存大展身手的领域。9950X3D2-DE使用Clang编译器、LLD链接器和Ninja构建工具通过MSYS2在Windows下编译LLVM源代码,用时不足5分钟,比9950X3D快约6.6%,比英特尔最新处理器快约10%。
多花200美元来节省21秒编译时间或许不值得,但对于处理Chromium等大型项目的开发者而言,节省的时间累积起来相当可观。
HPC与AI工作负载测试
售价899美元的Ryzen 9 9950X3D2-DE虽非工作站级产品,但已开始触及入门级Threadripper和至强W系列的领域,这对科研人员或对机器学习和生成式AI感兴趣的用户颇具吸引力。
在GROMACS分子动力学模拟测试中,9950X3D2-DE以143.56纳秒/天的成绩稳居榜首,比9950X3D快约9.3%,比英特尔酷睿Ultra 7 270K快近60%。这款处理器的大容量缓存和对AVX-512的完整支持在此充分体现了价值,也证明了少量高性能大核在特定场景下不输众多小核的道理。
在OpenFOAM 13摩托车空气动力学CFD测试中,9950X3D2-DE较慢的内存再度成为制约因素。该测试对计算和内存带宽均较为敏感。处理器虽仍以微弱优势领先,但相比300美元的酷睿Ultra 270K Plus,仅高出2.7%——原因在于英特尔开箱支持更快的DDR5 7200 MT/s内存,提供了更高的内存带宽。AMD处理器的优势则在于双倍的性能核心和192 MB末级缓存,有助于将中间计算过程保留在芯片上。
值得注意的是,AMD在其营销材料中宣称,在SpecWorkstation 4基准测试套件中OpenFOAM性能提升了26%,是相对9950X3D提升最显著的测试之一。我们相信这些数据的准确性,但该测试使用的是规模更小的2D Reynolds平均模拟,更小的网格可能使更多工作负载能够驻留在L3缓存中,从而带来更高的性能提升。
在本地AI推理测试中,GPU性能更强,但往往受限于显存不足,CPU推理因此成为在保护隐私前提下运行大语言模型的可行方案。
推理工作负载可分为两个阶段:计算密集型的预填充阶段(处理提示词并生成模型的键值缓存)和内存带宽密集型的解码阶段(自回归逐Token生成回复)。
AMD强劲的核心和深层缓存使9950X3D2-DE在预填充阶段高居榜首,但在解码阶段仍慢于英特尔。如果您希望用本地AI处理长文档摘要,AMD的AVX-512指令带来的更快预填充处理将大幅提升体验;但若主要用于交互式聊天,英特尔更快的内存支持将让酷睿Ultra系列感觉更加流畅。
在语音转文字测试中,9950X3D2-DE使用Whisper.cpp运行Whisper Medium EN模型转录10分钟音频,实现了6.3倍实时速度。与9950X3D相比,额外的缓存和更高TDP并无显著优势,而英特尔24核处理器在此与AMD旗舰性能相当。
游戏性能测试
AMD Ryzen 9 9000系列处理器历来并非游戏向产品,但这一定位随着2023年Ryzen 9 7900X3D和7950X3D的发布而改变——这两款处理器将高核心数与3D V-Cache技术的游戏性能优势相结合,只是存在散热问题,导致频率受限。
2024年底至2025年初,AMD 9000系列X3D处理器通过将V-Cache芯粒移至CCD下方,解决了散热问题,大幅提升了睿频频率,使AMD X3D系列成为目前市场上游戏性能最强的处理器。
直觉上,人们会认为再增加一块V-Cache芯片会让9950X3D2-DE在游戏中更出色,但事实并非如此。
我们会把这一部分说得简短一些,因为在我们全套游戏基准测试中,结论几乎一致:Ryzen 9双版本在大多数测试中比9950X3D略有优势,但与9850X3D相比差距微乎其微,甚至略有落后。
要理解为何9950X3D与双版本之间差距不大,需要了解核心停驻(Core Parking)机制。AMD在7000系列X3D处理器发布时引入了这一功能,以防止游戏任务落到错误的CCD上。这一功能后来扩展至所有多CCD Ryzen 9000系列处理器,其工作原理是在检测到受支持的应用程序或运行时,将其中一个计算芯粒停驻。启用该功能后,9950X的表现更像一款8核处理器。
尽管9950X3D2-DE的两块CCD均支持3D V-Cache技术,但核心停驻机制依然存在,且其出发点并非某一CCD是否搭载V-Cache,而更多是芯粒间通信方式的问题。9950X上的两块8核CCD并非直接互联,而是各自通过64 GB/s GMI链路连接至I/O和内存芯片。若某一CCD上的核心需要访问另一CCD缓存中的数据,必须经由I/O芯片中转,引入延迟并可能影响性能。对于生产力工作负载而言,这一问题影响不大,但在游戏场景下,这种延迟会严重拉低帧率,使核心停驻成为不可或缺的机制。
遗憾的是,这意味着AMD新旗舰在游戏性能上相比其8核或16核X3D产品并无任何优势。
总结
Ryzen 9 9950X3D2双版本是我们测试过的最快处理器,在几乎所有生产力基准测试中高居榜首,游戏表现与AMD早期旗舰基本持平。它正如其所宣称的那样:是凝聚成芯片形态的极致性能产物,售价也与其定位相称。
899美元的官方售价在当前经济环境下显得有些脱离现实。对PC发烧友而言,现在并不是最好的时机——内存和存储价格在过去一年内已飙升逾三倍,自行组装一台电脑对很多人来说已成为奢侈之举。
但话说回来,旗舰产品的发布真的有所谓"好时机"吗?AMD最新旗舰是一件展示其技术实力的工程典范,正是这些技术助力AMD在桌面处理器领域反超英特尔,令人叹为观止。
对于无力承担900美元处理器的用户而言,AMD显然也在利用消费者心理,让9800X3D、9850X3D和9950X3D显得更具性价比——"以低200至400美元的价格获得90%的生产力性能,或在游戏中与旗舰旗鼓相当",这确实是相当有力的购买理由。
这种对比或许无助于双版本的销量,但AMD从一开始可能就没打算卖出太多。
归根结底,我们的结论如下:合成基准测试的数据在纸面上看起来很美,但未必能反映真实世界的性能。我们正在持续扩充测试套件,纳入真正影响购买决策的实际生产力工作负载。
Q&A
Q1:Ryzen 9 9950X3D2双版本和普通9950X3D在游戏性能上有什么差异?
A:实际上两者在游戏性能上几乎没有差异。由于AMD的核心停驻机制,双版本处理器在游戏时同样只会激活单个CCD,因此与9850X3D和9950X3D的游戏表现基本相同。额外增加的第二块V-Cache芯粒对游戏帧率提升没有实质帮助。
Q2:Ryzen 9 9950X3D2双版本在生产力应用上值得加价200美元吗?
A:根据测试结果,双版本相比售价低200美元的标准9950X3D,在生产力工作负载中仅提升3%到9%,部分特定任务如LZMA压缩和GROMACS分子动力学模拟可达到更高提升。对于大多数用户而言,这一性能差距并不足以支撑如此高的溢价,但在超算模拟或大规模代码编译等专业场景下,节省的时间或许有一定价值。
Q3:Ryzen 9 9950X3D2双版本的内存支持规格是什么?
A:9950X3D2-DE官方支持最高JEDEC DDR5 5600 MT/s,但推荐使用DDR5 6000 MT/s,可实现内存时钟与控制器之间更优的1:1比率。AMD表示,DDR5 8000 MT/s在X870平台上也应该相对容易运行,但目前测试条件有限,且相应内存套件售价高达500至800美元。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。