扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
“Fermi”快要走了,“Kepler”还会远吗?
NVIDIA两年前公布的这张路线图应该还有人记得吧,按照当时的规划,Fermi架构之后NVIDIA显卡将进入Kepler时代,原本预计是在2011年底发布的,不过受限于TSMC台积电28nm工艺进展不利等多方面因素,Kepler一直拖到这个月才能发布。
早在Fermi显卡未发布之前,NVIDIA就公布了大量有关显卡架构的信息,有关Fermi的PDF资料非常详尽,NVIDIA乐此不疲地在多个场合公开展示Fermi显卡,即便黄总手中拿的只是个模型。那时NVIDIA的表现很高调,因为Fermi确实是划时代的变化,无论是游戏还是计算都让人刮目相看。
当然,首发的GTX 480/470作为显卡的表现是低于预期的,并非性能有问题,而是显卡的功耗和发热太高了,还好NVIDIA后续优化了工艺,微调了GF110架构推出的GTX 580/570,这种两款显卡的表现就好多了,可以为市场和消费者接受了。
面对HD 7970的进攻GTX 580的性能还是略输一点,NVIDIA也要升级架构了
时光荏苒,现在又到了架构升级的时刻了。只是与Fermi时代相比,NVIDIA的表现显得低调了许多,Kepler直到这个月才在GDC 2012大会上展出,现场演示了EPIC的《Samaritan》demo,不过还是封闭系统,看不到实卡。
官方闭口不言,我们能获得有关Kepler显卡的来源就只有媒体传闻以及各路“大神”的私下爆料了,有关Kepler的新闻大都是“传xxxxx”,简单来说就是只能在各种传闻和泄露中捕捉有关Kepler的信息。
传闻不一定是可靠的,不过IT媒体的传闻并非简单的谣言,除了一部分哗众取宠的臆造(比如Kepler的PhysX模块)之外,很多传闻应该是空穴来风,是厂商或者知情人士放出来探口风,里面当然有真有假,只要多多对比、小心分析还是能从中得到一些准确信息的。
现在里Kepler正式发布只有一周的时间了,不过有关Kepler的性能、架构、核心以及价格等方面的信息还没有准确的消息,今天我们就从各种传闻中摸清Kepler显卡的底细,看看NVIDIA低调的背后是惊人的爆发还是真的技不如人。
Kepler能否重新夺回世界最快的显卡称号?
命名:谍战剧一般精彩
显卡的名字就跟人名一样,名字好坏给人的第一印象也会大相径庭,同一个人叫“高富帅”还是“高二狗”是有明显区别的。当然,显卡的命名更简单了一些,一般就是字母+数字的形式,但是在GK104身上,显卡命名的跌宕回肠足以媲美国产谍战剧。
我们都知道这一代NVIDIA显卡属于“Kepler”家族,架构代号也不再是GF开头,而是代之以GK。按照惯例,首先出的应该是旗舰级的GK110架构,据传它有1024个CUDA核心,60亿个晶体管,512bit显存,规格基本是GTX 580的翻倍,甚至还泄露了它的GPU-Z信息图。
早期流传的GK110核心GPU-Z规格图
早期都认为NVIDIA将跳过GTX 600命名,GK110将直接进入GTX 700序列,不过GTX 700的流言只存在了很短时间,因为NVIDIA并没有打算跳过GTX 600系列,而且初期发布的并非GK110核心,它将让位于中端的核心GK104。除了NVIDIA自己,没人知道他们为什么要先发GK104,GK110难度太大还是TSMC工艺不给力,或许两者兼有。
既然首发的是GK104,那么它又叫什么呢?对比当前的核心以及显卡命名,有人称GK104将命名为GTX 660 Ti,并有衍生版本GTX 660,这个流言既贴近现实,又符合传统,按理来说应该是最可能的,遗憾的是你猜中了开头,却猜不到结尾。
进入2月之后,GK104的具体名称锁定在了GTX 670 Ti以及GTX 680身上,SA网站也报道过说GK104将有两种核心,完整版的为GK104-400,拥有8组SM单元,将命名为GTX 680,而次阶的为GK104-335,拥有7组SM单元,将成为GTX 670(当时没说带Ti后缀),关系有点类似目前的GTX 580以及GTX 570。
再往后,Sweclockers援引台湾某显卡厂商的消息称GK104将以GTX 670 Ti的名义在CeBIT展会之后发布。
从本月初开始曝光的实物图开始增多,首先是RedQUASAR论坛曝光了GTX 670 Ti显卡实物照片,从上面的印记来看,显卡确实是GTX 670 Ti,既然官方都写上名字了,看来GTX 670 Ti确有其事。
不幸的是,GTX 670 Ti没活几天,各路达人又爆料说GTX 670 Ti只是NVIDIA的烟雾弹,刷BIOS之后就会变成GTX 680,性能暴增40%,而这才是它的正式身份和能力。(现在来看显卡上雕刻GTX 670 Ti字样的做法也太明显了,之前的N卡上只有贴纸,没有这样的字样)
这么多名称到底哪个是对的?该到揭晓答案的时刻了,GK104发布时的名字确实就是FeForce GTX 680,GTX 670 Ti只是NVIDIA迷惑对手的工具。当然后续可能还是有GTX 670 Ti这个型号的显卡的,不过首发时没有GTX 670 Ti的份。
回顾有关Kepler显卡的命名一事,你会发现这里面谋略重重,一环扣一环。从早期的GTX 700若隐若现到GTX 600浮出水面,从GTX 660 Ti的合理推断到GTX 670 Ti的出其不意,最后又到了GTX 680尘埃落定,NVIDIA、现场厂商、媒体以及爆料达人把三十六计用得出神入化,故弄玄虚、声东击西、无中生有、浑水摸鱼等等一一呈现,除了迷惑对手之外,也吸引了大批“不明真相的群众”围观,闹得用户心神不定,到底是买已上市的HD 7000系列还是等待GK104上市呢。
当然这还只是显卡名称上的风波,如果再算上规格、性能、价格以及发布日期等方面的消息,这出戏还要精彩的多,要比《潜伏》、《窃听风云》这样的谍战剧还要刺激,这都是后话了。
规格:像雾像风又像雨
在命名上做文章顶多是障眼法,规格上的泄露才有实质性意义,因为规格可以透露很多秘密,内容远比名称更丰富。在这一点上,GK104的规格泄密也像是挤牙膏一样,一点点爆料,但是各方来源又是欲说还休,最终也是像雾像风又像雨。
核心面积
也许是对前两代大核心战略显卡忍够了,Kepler最为人关注的一个问题就是核心面积,是继续Fermi那样的巨核高性能还是类似AMD这样的Smart Die呢?NVIDIA公开做的回应是选择了前者,依然是追求性能第一,不过这也不代表Kepler的核心会更大。
以GK104为例,核心面积一直秘而不宣,之前的爆料称其核心长宽约为18-19mm,面积在324-321mm2之间,比GTX 580的530mm2大大降低,而且低于HD 7970的365mm2。
GK104的PCB曝光之后,有人根据它与HD 7970显卡的PCB对比计算出其核心面积约为320mm2,符合之前的猜测。
前两天我们获得了GK104的核心图,显示GK104核心呈正方形,长宽都在17mm左右,核心面积大约是300mm2,比之前提到过的都要小。
现在可以确定的是GK104是小核心,比HD 7970还要低很多。同时,伴随核心面积降低的还有TDP功耗,3Dcenter的报道显示其TDP功耗只有190W左右,低于HD 7970的210W(最大功耗为250W),更低于GTX 580的244W。
核心频率:低频or高频?还有动态加速
小核心确定了,那么GK104的频率有多高?这一点有两个版本,首先是高频版,GK104的功耗和发热解决之后,显卡可以工作在更高频率,核心频率将超过900MHz甚至1GHz,而且shader频率也不再是原来的2:1分频模式,将会同频运行。
之前PCI论坛爆料GK104性能时显示频率达到1050MHz
另一种观点是GK104的核心频率不会太高,只有705MHz,但是Shader频率继续2:1模式从而达到1411MHz,VR-Zone报道过GK104的详细规格,而泄露的笔记本型号上使用的GK107架构也确实是原来的2:1分频模式。
NBR论坛上放出的GK107架构显示Kepler依然是2:1分频模式
显存的规格是NVIDIA早就确认了的,256bit位宽,2GB GDDR5显存容量,但是频率相比Fermi时代徘徊在1000MHz而言大幅提升,达到了1500MHz(等效6.0GHz)。
此外,NVIDIA并不满足固定的核心频率,GTX 680将支持动态超频技术(dynamic clocking),因为多数游戏中显卡并非满负载运行,距离TDP功耗还有一点空间,显卡频率还有提升的空间。这一技术类似CPU中的Turbo Boost加速,BIOS可以根据显卡负载动态调整频率,进而自动超频5%以提高性能。
泄露的NVIDIA官方文档显示核心频率确实过1G(来源:太平洋电脑网)
最后隔壁网站泄露了完整的GTX 680规格,频率确实达到了1GHz以上,动态加速还能继续提高5%左右。
PCB设计:使用均热板,横向排列的供电?
PCI论坛很快有人泄露了GK104的散热以及供电电路设计,显示GTX 680显卡的散热器与目前的GTX 580大有不同,首次使用类似均热板那样的嵌入式热管,散热鳍片也是单独定制的,排列更紧密。风扇还是涡轮式,但是经过噪音抑制处理,静音水平比前代要好。
随同曝光的还有显卡的PCB以及供电接口。
供电分为5+2相,5相GPU核心,2相显存,最奇特的是5相PCB供电电路改成横向排列,这几年的显卡里非常少见。
垂直排列的供电接口比传统方式占用空间更少
架构:源自GF104还是GF110?
显卡的规格参数也确定了,核心架构也有了准确的消息。Kepler的流处理器单元(NVIDIA也叫CUDA核心,以下统称CUDA核心)也大幅攀升,GK104将拥有1536个CUDA核心,相比GTX 580提高了2倍,NVIDIA如何在芯片面积大降的同时塞入更多的核心呢
回想前两年的情况,对NVIDIA来说开发Fermi架构的过程无疑是艰难的,它太庞大了,但抛开难产的过程不谈,Fermi架构是NVIDIA的得意之作,无论是游戏还是通用计算上都能左右逢源,Kepler显卡的架构不可能重起炉灶,必然是在Fermi架构基础上修改而来。
众所周知,Fermi家族衍生出两大核心,一个是完整版的GF100以及后续的改进型GF110,另外一个就是GF104以及后续优化的GF114(其实GF114=GF104),Kepler更像哪一个架构呢?
GF110架构:高性能、高代价
GF100/GF100架构示意图
首先来看GF110,它分为4组GPC,每组下辖4组SM单元,每组SM单元又有32个CUDA核心,总计有512个CUDA核心,64个纹理单元,48个ROP单元,16个曲面细分单元,搭配6组64bit显存控制器,总计384bit位宽,1536MB显存。
GF110架构中的每组SM单元设计
这些是看得见的参数,实际上Fermi之所以这么设计主要是为了HPC高性能计算,具体到每组SM单元中又是由32个CUDA内核为基础运算单元,每个内核又包括完整功能的整数单元和浮点单元,配备64KB L1缓存,16个LD/ST存储单元以及四个SFU多功能单元。
GF100架构用在通用计算方面的确是最合适的,16组SM意味着16个运算单元(OpenCL计算中是以SM单元数量为计算单位的,GPLBench或者Luxmark中都要看SM单元数量,AMD的现在称为CU单元),GPU通用计算上比前代GT200架构有着质的提高。
当然,GF100的代价也是巨大的,核心面积达到530mm2,发热也很恐怖,第一代GTX 480显卡甚至需要阉割部分CUDA核心才能控制住功耗和发热。
实际上游戏运算跟GPU通用计算并不是一条路,Fermi架构的为了提高数据吞吐量配置了大容量L1、L2缓存对3D游戏用处并不大,所以NVIDIA为Fermi架构准备了B计划,精简规格,提高效率,推出了GF104架构。
GF104:精简,高效
GF114架构示意图
GF104架构首先应用与GTX 460显卡上,GPC只有2组,SM单元数量也从16组减少到8组,但是每组SM单元的CUDA核心数提高到48个,看起来是增加了,不过在其他单元如调度器、寄存器、L1缓存没有增加的情况这意味着资源争抢的情况也多了,对数据计算来说意味着削弱,但是对图形运算来说是增强。
除了CUDA数量变化之外,GF104的L2缓存也减少了,内存控制器减少到4组,位宽256bit,曲面细分单元也减少到8组,但是纹理单元依然维持在64个,ROP单元还有32个,图形性能受损不如规格精简幅度那样大,而功耗与核心面积却大大降低了,无论是GTX 460还是之后的GTX 560 Ti、GTX 560在温度与功耗上反倒比高端显卡还要好。
网上流传的一张GK104架构图,明显更像GF100架构一些
那么Kepler的架构应该源自哪一个?GK104架构确信有1536个流处理器,恰好是GF110的3倍,浴室上个月就有人PS了上面这张图,显示GK104将有16组SM单元,每组SM单元变成96个CUDA核心,恰好符合1536个流处理器的特征。
初看一下似乎也很合理,不过实际情况却不是这样。这么说似乎有些马后炮的感觉,但是GK104并非GF110那样的旗舰定位,而是类似GF114这样的中高端显卡,而且有GF104成功的先例在前,NVIDIA没理由去复制GF110架构设计。
实际上GK104的架构更像GF114
最终的结果就是GK104的架构更像GF104,它的每组SM单元中塞下了192个CUDA核心,是GF110架构的6倍,是GF104架构的4倍,SM单元总数也不是16组,还是8组,这样总计有1536个CUDA核心,1536的数值是这么算出来的,而非GF110乘以3那样。
目前知道的架构设计就是这些,纹理单元未知,不过纹理单元是跟SM中的SFU单元对应的,GF100架构中每组SM单元有4个TA纹理寻址单元、16个TF纹理过滤单元,GF104中每组SM提高到8个TA、32个TF,GK104的纹理单元有说是128个,也有说160个,目前还没有确切消息,需要等到GK104的架构完全公布才能知晓。
两个未解之谜,GK104的后续等等
从这两三个月的各种流言蜚语以及爆料之中我们已经可以为GTX 680画像了,它使用TSMC 28nm工艺制造,核心面积约300mm2,TDP功耗195W。核心频率超过1GHz,显存频率达到1500MHz,标准2GB/256bit GDDR5显存。
其显卡为封闭式内排方案,使用了嵌入式热管设计,涡轮风扇做了噪音抑制改进,不过具体效果未知。显卡供电为5相GPU,2相显存,主供电搭配1上2下MOSFET,其他的还芯片还不太清楚,而供电接口只需要两个6pin,一改以往旗舰单卡的6+8pin标准配置。
只是我们还有两个最主要的谜题没能揭开,Kepler的性能和售价还没有准确消息。有人说NVIDIA凡是以80命名的显卡在性能上就没输过,从最早的DX10显卡GTX 8800 算起,在GTX 280、GTX 480、GTX580身上确实如此,这话还是蛮准的。由于HD 7970已经发布了三个月了,NVIDIA对其性能也是心知肚明,在这种情况下还把GK104命名为GTX 680说明他们还是有信心的。
具体的性能数据上小编没有,而且就算有也不能泄露,不过根据厂商的反馈,GTX 680轻松超过HD 7970是没问题的,至于能否达到40%的领先就不好说了,而且NVIDIA内部测试的驱动更新频繁,每次更新都有性能提升,尚不知测试时是哪个版本的驱动。
另一个关键问题是价格,看了前面的分析连小编也觉得GTX 680将是接近完美的一张卡,低发热、低功耗的同时高性能,这种情况下只有傻子才会制定出比HD 7970更便宜的价格,SA炮制出的299美元已成泡影,3DCenter给出的价格是549美元(人民币3500左右),与HD 7970同一水平,后者的国内定价是4299-4699元,GTX 680的国内售价就自己想吧。
Kepler一来,GTX 580已经开始降价了,支持4屏的影驰HOF GTX 580显卡只有3999元
当然,Kepler的消息一确定,最让消费者受益的还是当前的显卡大降价,欧洲市场上公版GTX 580的售价降到了339欧元(人民币2800元),非公版也有10-15%的降价。
GK104的问题到现在就算终结了,谈下一话题:那就是GK104的后续是什么?(先无视低端的GK107)
很多人会说这不明摆着呢吗,编号x04的核心只不过是中端定位,旗舰级的还是留给GK110核心,规格也都曝光过多次了,2304个CUDA核心,160个纹理单元,48个R0P单元,显存位宽、容量分别为384bit、3GB,将在今年8月份发布。
是的,很多消息都是这么说,但是谁说一定会有更高级别的核心?NVIDIA既然能在显卡命名上放烟雾弹,为什么GK110不是烟雾弹?仔细想下,GK104已经把旗舰级的GTX 680命名占用了,更高阶的显卡如何命名?GTX 685,这个也有可能,毕竟GTX 280以及GTX 285就同时存在过,但是GTX 680显卡在性能、功耗控制上表现都会比HD 7970要好,NVIDIA还有必要再出一款更高级别的核心吗?
啰嗦了这么多,个人的观点就是如果GTX 680的表现确实非常给力,那么GK110就没有理由这么快出现,而GK110很可能只是接下来的双芯卡的代号(你可以注意一下目前的新闻中提到GK104的双芯卡时从来就没有提到过它的架构代号),目前有关GK110规格的消息依然是烟雾弹。
这里并不否认更强的核心的存在,不过它应该是为了对付AMD HD 8000系列而来的,GTX 600系列已经被NVIDIA用完了,那么它很可能命名为GTX 700系列,类似NVIDIA之前对待GTX 480以及GTX 580一样,不同的是GTX 680不会有GTX 480那么杯具的功耗和发热。
PS:以上观点为个人猜想,没有内幕消息支持,至于实际情况会不会是这样我也先立贴为证,也欢迎大家提出自己的看法。
NVIDIA现在喜欢用物理学家的名字命名显卡架构,Kepler除了是物理学家之外还是天文学家。面对这个“浩瀚的宇宙“,我们目前只了解了一部分,还有更多的未知之谜需要等待实际评测才能解开。
Kepler家族将在3月22日太平洋时间早上6点、本地时间22日晚上9点解禁,到时超能网也会奉上详细的评测,为你揭秘最真实的GTX 680显卡。
Hello,Kepler。