ZDNet>服务器频道>芯片>“开普勒”的望远镜从传闻看GK104的真实架构

“开普勒”的望远镜从传闻看GK104的真实架构

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

NVIDIA两年前公布的这张路线图应该还有人记得吧，按照当时的规划，Fermi架构之后NVIDIA显卡将进入Kepler时代，原本预计是在2011年底发布的，不过受限于TSMC台积电28nm工艺进展不利等多方面因素，Kepler一直拖到这个月才能发布。

来源：超能网 2012年03月15日

关键字：GPU NVIDIA 开普勒 Tesla

返回分页阅读

“Fermi”快要走了，“Kepler”还会远吗？

“开普勒”的望远镜从传闻看GK104的真实架构

早在Fermi显卡未发布之前，NVIDIA就公布了大量有关显卡架构的信息，有关Fermi的PDF资料非常详尽，NVIDIA乐此不疲地在多个场合公开展示Fermi显卡，即便黄总手中拿的只是个模型。那时NVIDIA的表现很高调，因为Fermi确实是划时代的变化，无论是游戏还是计算都让人刮目相看。

当然，首发的GTX 480/470作为显卡的表现是低于预期的，并非性能有问题，而是显卡的功耗和发热太高了，还好NVIDIA后续优化了工艺，微调了GF110架构推出的GTX 580/570，这种两款显卡的表现就好多了，可以为市场和消费者接受了。

“开普勒”的望远镜从传闻看GK104的真实架构
面对HD 7970的进攻GTX 580的性能还是略输一点，NVIDIA也要升级架构了

时光荏苒，现在又到了架构升级的时刻了。只是与Fermi时代相比，NVIDIA的表现显得低调了许多，Kepler直到这个月才在GDC 2012大会上展出，现场演示了EPIC的《Samaritan》demo，不过还是封闭系统，看不到实卡。

官方闭口不言，我们能获得有关Kepler显卡的来源就只有媒体传闻以及各路“大神”的私下爆料了，有关Kepler的新闻大都是“传xxxxx”，简单来说就是只能在各种传闻和泄露中捕捉有关Kepler的信息。

传闻不一定是可靠的，不过IT媒体的传闻并非简单的谣言，除了一部分哗众取宠的臆造（比如Kepler的PhysX模块）之外，很多传闻应该是空穴来风，是厂商或者知情人士放出来探口风，里面当然有真有假，只要多多对比、小心分析还是能从中得到一些准确信息的。

现在里Kepler正式发布只有一周的时间了，不过有关Kepler的性能、架构、核心以及价格等方面的信息还没有准确的消息，今天我们就从各种传闻中摸清Kepler显卡的底细，看看NVIDIA低调的背后是惊人的爆发还是真的技不如人。

“开普勒”的望远镜从传闻看GK104的真实架构
Kepler能否重新夺回世界最快的显卡称号？

命名：谍战剧一般精彩

显卡的名字就跟人名一样，名字好坏给人的第一印象也会大相径庭，同一个人叫“高富帅”还是“高二狗”是有明显区别的。当然，显卡的命名更简单了一些，一般就是字母+数字的形式，但是在GK104身上，显卡命名的跌宕回肠足以媲美国产谍战剧。

我们都知道这一代NVIDIA显卡属于“Kepler”家族，架构代号也不再是GF开头，而是代之以GK。按照惯例，首先出的应该是旗舰级的GK110架构，据传它有1024个CUDA核心，60亿个晶体管，512bit显存，规格基本是GTX 580的翻倍，甚至还泄露了它的GPU-Z信息图。

“开普勒”的望远镜从传闻看GK104的真实架构
早期流传的GK110核心GPU-Z规格图

早期都认为NVIDIA将跳过GTX 600命名，GK110将直接进入GTX 700序列，不过GTX 700的流言只存在了很短时间，因为NVIDIA并没有打算跳过GTX 600系列，而且初期发布的并非GK110核心，它将让位于中端的核心GK104。除了NVIDIA自己，没人知道他们为什么要先发GK104，GK110难度太大还是TSMC工艺不给力，或许两者兼有。

既然首发的是GK104，那么它又叫什么呢？对比当前的核心以及显卡命名，有人称GK104将命名为GTX 660 Ti，并有衍生版本GTX 660，这个流言既贴近现实，又符合传统，按理来说应该是最可能的，遗憾的是你猜中了开头，却猜不到结尾。

进入2月之后，GK104的具体名称锁定在了GTX 670 Ti以及GTX 680身上，SA网站也报道过说GK104将有两种核心，完整版的为GK104-400，拥有8组SM单元，将命名为GTX 680，而次阶的为GK104-335，拥有7组SM单元，将成为GTX 670（当时没说带Ti后缀），关系有点类似目前的GTX 580以及GTX 570。

再往后，Sweclockers援引台湾某显卡厂商的消息称GK104将以GTX 670 Ti的名义在CeBIT展会之后发布。

“开普勒”的望远镜从传闻看GK104的真实架构

从本月初开始曝光的实物图开始增多，首先是RedQUASAR论坛曝光了GTX 670 Ti显卡实物照片，从上面的印记来看，显卡确实是GTX 670 Ti，既然官方都写上名字了，看来GTX 670 Ti确有其事。

“开普勒”的望远镜从传闻看GK104的真实架构

不幸的是，GTX 670 Ti没活几天，各路达人又爆料说GTX 670 Ti只是NVIDIA的烟雾弹，刷BIOS之后就会变成GTX 680，性能暴增40%，而这才是它的正式身份和能力。（现在来看显卡上雕刻GTX 670 Ti字样的做法也太明显了，之前的N卡上只有贴纸，没有这样的字样）

这么多名称到底哪个是对的？该到揭晓答案的时刻了，GK104发布时的名字确实就是FeForce GTX 680，GTX 670 Ti只是NVIDIA迷惑对手的工具。当然后续可能还是有GTX 670 Ti这个型号的显卡的，不过首发时没有GTX 670 Ti的份。

回顾有关Kepler显卡的命名一事，你会发现这里面谋略重重，一环扣一环。从早期的GTX 700若隐若现到GTX 600浮出水面，从GTX 660 Ti的合理推断到GTX 670 Ti的出其不意，最后又到了GTX 680尘埃落定，NVIDIA、现场厂商、媒体以及爆料达人把三十六计用得出神入化，故弄玄虚、声东击西、无中生有、浑水摸鱼等等一一呈现，除了迷惑对手之外，也吸引了大批“不明真相的群众”围观，闹得用户心神不定，到底是买已上市的HD 7000系列还是等待GK104上市呢。

当然这还只是显卡名称上的风波，如果再算上规格、性能、价格以及发布日期等方面的消息，这出戏还要精彩的多，要比《潜伏》、《窃听风云》这样的谍战剧还要刺激，这都是后话了。

规格：像雾像风又像雨

在命名上做文章顶多是障眼法，规格上的泄露才有实质性意义，因为规格可以透露很多秘密，内容远比名称更丰富。在这一点上，GK104的规格泄密也像是挤牙膏一样，一点点爆料，但是各方来源又是欲说还休，最终也是像雾像风又像雨。

核心面积

也许是对前两代大核心战略显卡忍够了，Kepler最为人关注的一个问题就是核心面积，是继续Fermi那样的巨核高性能还是类似AMD这样的Smart Die呢？NVIDIA公开做的回应是选择了前者，依然是追求性能第一，不过这也不代表Kepler的核心会更大。

以GK104为例，核心面积一直秘而不宣，之前的爆料称其核心长宽约为18-19mm，面积在324-321mm2之间，比GTX 580的530mm2大大降低，而且低于HD 7970的365mm2。

“开普勒”的望远镜从传闻看GK104的真实架构

GK104的PCB曝光之后，有人根据它与HD 7970显卡的PCB对比计算出其核心面积约为320mm2，符合之前的猜测。

前两天我们获得了GK104的核心图，显示GK104核心呈正方形，长宽都在17mm左右，核心面积大约是300mm2，比之前提到过的都要小。

现在可以确定的是GK104是小核心，比HD 7970还要低很多。同时，伴随核心面积降低的还有TDP功耗，3Dcenter的报道显示其TDP功耗只有190W左右，低于HD 7970的210W（最大功耗为250W），更低于GTX 580的244W。

核心频率：低频or高频？还有动态加速

小核心确定了，那么GK104的频率有多高？这一点有两个版本，首先是高频版，GK104的功耗和发热解决之后，显卡可以工作在更高频率，核心频率将超过900MHz甚至1GHz，而且shader频率也不再是原来的2：1分频模式，将会同频运行。

“开普勒”的望远镜从传闻看GK104的真实架构
之前PCI论坛爆料GK104性能时显示频率达到1050MHz

另一种观点是GK104的核心频率不会太高，只有705MHz，但是Shader频率继续2：1模式从而达到1411MHz，VR-Zone报道过GK104的详细规格，而泄露的笔记本型号上使用的GK107架构也确实是原来的2：1分频模式。

“开普勒”的望远镜从传闻看GK104的真实架构
NBR论坛上放出的GK107架构显示Kepler依然是2：1分频模式

显存的规格是NVIDIA早就确认了的，256bit位宽，2GB GDDR5显存容量，但是频率相比Fermi时代徘徊在1000MHz而言大幅提升，达到了1500MHz（等效6.0GHz）。

此外，NVIDIA并不满足固定的核心频率，GTX 680将支持动态超频技术（dynamic clocking），因为多数游戏中显卡并非满负载运行，距离TDP功耗还有一点空间，显卡频率还有提升的空间。这一技术类似CPU中的Turbo Boost加速，BIOS可以根据显卡负载动态调整频率，进而自动超频5%以提高性能。

“开普勒”的望远镜从传闻看GK104的真实架构
泄露的NVIDIA官方文档显示核心频率确实过1G（来源：太平洋电脑网）

最后隔壁网站泄露了完整的GTX 680规格，频率确实达到了1GHz以上，动态加速还能继续提高5%左右。

PCB设计：使用均热板，横向排列的供电？

PCI论坛很快有人泄露了GK104的散热以及供电电路设计，显示GTX 680显卡的散热器与目前的GTX 580大有不同，首次使用类似均热板那样的嵌入式热管，散热鳍片也是单独定制的，排列更紧密。风扇还是涡轮式，但是经过噪音抑制处理，静音水平比前代要好。

“开普勒”的望远镜从传闻看GK104的真实架构
随同曝光的还有显卡的PCB以及供电接口。

“开普勒”的望远镜从传闻看GK104的真实架构

供电分为5+2相，5相GPU核心，2相显存，最奇特的是5相PCB供电电路改成横向排列，这几年的显卡里非常少见。

“开普勒”的望远镜从传闻看GK104的真实架构
垂直排列的供电接口比传统方式占用空间更少

架构：源自GF104还是GF110？

显卡的规格参数也确定了，核心架构也有了准确的消息。Kepler的流处理器单元（NVIDIA也叫CUDA核心，以下统称CUDA核心）也大幅攀升，GK104将拥有1536个CUDA核心，相比GTX 580提高了2倍，NVIDIA如何在芯片面积大降的同时塞入更多的核心呢

回想前两年的情况，对NVIDIA来说开发Fermi架构的过程无疑是艰难的，它太庞大了，但抛开难产的过程不谈，Fermi架构是NVIDIA的得意之作，无论是游戏还是通用计算上都能左右逢源，Kepler显卡的架构不可能重起炉灶，必然是在Fermi架构基础上修改而来。

众所周知，Fermi家族衍生出两大核心，一个是完整版的GF100以及后续的改进型GF110，另外一个就是GF104以及后续优化的GF114（其实GF114=GF104），Kepler更像哪一个架构呢？

GF110架构：高性能、高代价

“开普勒”的望远镜从传闻看GK104的真实架构
GF100/GF100架构示意图

首先来看GF110，它分为4组GPC，每组下辖4组SM单元，每组SM单元又有32个CUDA核心，总计有512个CUDA核心，64个纹理单元，48个ROP单元，16个曲面细分单元，搭配6组64bit显存控制器，总计384bit位宽，1536MB显存。

“开普勒”的望远镜从传闻看GK104的真实架构
GF110架构中的每组SM单元设计

这些是看得见的参数，实际上Fermi之所以这么设计主要是为了HPC高性能计算，具体到每组SM单元中又是由32个CUDA内核为基础运算单元，每个内核又包括完整功能的整数单元和浮点单元，配备64KB L1缓存，16个LD/ST存储单元以及四个SFU多功能单元。

GF100架构用在通用计算方面的确是最合适的，16组SM意味着16个运算单元（OpenCL计算中是以SM单元数量为计算单位的，GPLBench或者Luxmark中都要看SM单元数量，AMD的现在称为CU单元），GPU通用计算上比前代GT200架构有着质的提高。

当然，GF100的代价也是巨大的，核心面积达到530mm2，发热也很恐怖，第一代GTX 480显卡甚至需要阉割部分CUDA核心才能控制住功耗和发热。

实际上游戏运算跟GPU通用计算并不是一条路，Fermi架构的为了提高数据吞吐量配置了大容量L1、L2缓存对3D游戏用处并不大，所以NVIDIA为Fermi架构准备了B计划，精简规格，提高效率，推出了GF104架构。

GF104:精简，高效

“开普勒”的望远镜从传闻看GK104的真实架构
GF114架构示意图

GF104架构首先应用与GTX 460显卡上，GPC只有2组，SM单元数量也从16组减少到8组，但是每组SM单元的CUDA核心数提高到48个，看起来是增加了，不过在其他单元如调度器、寄存器、L1缓存没有增加的情况这意味着资源争抢的情况也多了，对数据计算来说意味着削弱，但是对图形运算来说是增强。

除了CUDA数量变化之外，GF104的L2缓存也减少了，内存控制器减少到4组，位宽256bit，曲面细分单元也减少到8组，但是纹理单元依然维持在64个，ROP单元还有32个，图形性能受损不如规格精简幅度那样大，而功耗与核心面积却大大降低了，无论是GTX 460还是之后的GTX 560 Ti、GTX 560在温度与功耗上反倒比高端显卡还要好。

“开普勒”的望远镜从传闻看GK104的真实架构
网上流传的一张GK104架构图，明显更像GF100架构一些

那么Kepler的架构应该源自哪一个？GK104架构确信有1536个流处理器，恰好是GF110的3倍，浴室上个月就有人PS了上面这张图，显示GK104将有16组SM单元，每组SM单元变成96个CUDA核心，恰好符合1536个流处理器的特征。

初看一下似乎也很合理，不过实际情况却不是这样。这么说似乎有些马后炮的感觉，但是GK104并非GF110那样的旗舰定位，而是类似GF114这样的中高端显卡，而且有GF104成功的先例在前，NVIDIA没理由去复制GF110架构设计。

“开普勒”的望远镜从传闻看GK104的真实架构
实际上GK104的架构更像GF114

最终的结果就是GK104的架构更像GF104，它的每组SM单元中塞下了192个CUDA核心，是GF110架构的6倍，是GF104架构的4倍，SM单元总数也不是16组，还是8组，这样总计有1536个CUDA核心，1536的数值是这么算出来的，而非GF110乘以3那样。

目前知道的架构设计就是这些，纹理单元未知，不过纹理单元是跟SM中的SFU单元对应的，GF100架构中每组SM单元有4个TA纹理寻址单元、16个TF纹理过滤单元，GF104中每组SM提高到8个TA、32个TF，GK104的纹理单元有说是128个，也有说160个，目前还没有确切消息，需要等到GK104的架构完全公布才能知晓。　

两个未解之谜，GK104的后续等等

从这两三个月的各种流言蜚语以及爆料之中我们已经可以为GTX 680画像了，它使用TSMC 28nm工艺制造，核心面积约300mm2，TDP功耗195W。核心频率超过1GHz，显存频率达到1500MHz，标准2GB/256bit GDDR5显存。

其显卡为封闭式内排方案，使用了嵌入式热管设计，涡轮风扇做了噪音抑制改进，不过具体效果未知。显卡供电为5相GPU，2相显存，主供电搭配1上2下MOSFET，其他的还芯片还不太清楚，而供电接口只需要两个6pin，一改以往旗舰单卡的6+8pin标准配置。

只是我们还有两个最主要的谜题没能揭开，Kepler的性能和售价还没有准确消息。有人说NVIDIA凡是以80命名的显卡在性能上就没输过，从最早的DX10显卡GTX 8800 算起，在GTX 280、GTX 480、GTX580身上确实如此，这话还是蛮准的。由于HD 7970已经发布了三个月了，NVIDIA对其性能也是心知肚明，在这种情况下还把GK104命名为GTX 680说明他们还是有信心的。

具体的性能数据上小编没有，而且就算有也不能泄露，不过根据厂商的反馈，GTX 680轻松超过HD 7970是没问题的，至于能否达到40%的领先就不好说了，而且NVIDIA内部测试的驱动更新频繁，每次更新都有性能提升，尚不知测试时是哪个版本的驱动。

另一个关键问题是价格，看了前面的分析连小编也觉得GTX 680将是接近完美的一张卡，低发热、低功耗的同时高性能，这种情况下只有傻子才会制定出比HD 7970更便宜的价格，SA炮制出的299美元已成泡影，3DCenter给出的价格是549美元（人民币3500左右），与HD 7970同一水平，后者的国内定价是4299-4699元，GTX 680的国内售价就自己想吧。

“开普勒”的望远镜从传闻看GK104的真实架构
Kepler一来，GTX 580已经开始降价了，支持4屏的影驰HOF GTX 580显卡只有3999元

当然，Kepler的消息一确定，最让消费者受益的还是当前的显卡大降价，欧洲市场上公版GTX 580的售价降到了339欧元（人民币2800元），非公版也有10-15%的降价。

GK104的问题到现在就算终结了，谈下一话题：那就是GK104的后续是什么？（先无视低端的GK107）

很多人会说这不明摆着呢吗，编号x04的核心只不过是中端定位，旗舰级的还是留给GK110核心，规格也都曝光过多次了，2304个CUDA核心，160个纹理单元，48个R0P单元，显存位宽、容量分别为384bit、3GB，将在今年8月份发布。

是的，很多消息都是这么说，但是谁说一定会有更高级别的核心？NVIDIA既然能在显卡命名上放烟雾弹，为什么GK110不是烟雾弹？仔细想下，GK104已经把旗舰级的GTX 680命名占用了，更高阶的显卡如何命名？GTX 685，这个也有可能，毕竟GTX 280以及GTX 285就同时存在过，但是GTX 680显卡在性能、功耗控制上表现都会比HD 7970要好，NVIDIA还有必要再出一款更高级别的核心吗？

啰嗦了这么多，个人的观点就是如果GTX 680的表现确实非常给力，那么GK110就没有理由这么快出现，而GK110很可能只是接下来的双芯卡的代号（你可以注意一下目前的新闻中提到GK104的双芯卡时从来就没有提到过它的架构代号），目前有关GK110规格的消息依然是烟雾弹。

这里并不否认更强的核心的存在，不过它应该是为了对付AMD HD 8000系列而来的，GTX 600系列已经被NVIDIA用完了，那么它很可能命名为GTX 700系列，类似NVIDIA之前对待GTX 480以及GTX 580一样，不同的是GTX 680不会有GTX 480那么杯具的功耗和发热。

PS：以上观点为个人猜想，没有内幕消息支持，至于实际情况会不会是这样我也先立贴为证，也欢迎大家提出自己的看法。

NVIDIA现在喜欢用物理学家的名字命名显卡架构，Kepler除了是物理学家之外还是天文学家。面对这个“浩瀚的宇宙“，我们目前只了解了一部分，还有更多的未知之谜需要等待实际评测才能解开。

Kepler家族将在3月22日太平洋时间早上6点、本地时间22日晚上9点解禁，到时超能网也会奉上详细的评测，为你揭秘最真实的GTX 680显卡。

Hello，Kepler。

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅ZDNet技术邮件将是您的最佳途径之一。

“开普勒”的望远镜从传闻看GK104的真实架构

业界热点:

技术关键字:

“开普勒”的望远镜 从传闻看GK104的真实架构

业界热点:

技术关键字:

“开普勒”的望远镜从传闻看GK104的真实架构