扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNet 服务器频道 5月16日 美国圣何塞报道(文/孟庆):沸沸扬扬的暗黑破坏神3在湾区发布,然而我的心思却在同期举行的NVIDIA GTC大会上,美国时间15日,黄仁勋的开场主题演讲正式为GTC2012拉开帷幕。从之前的信息来看,我们可以期待以下3点内容:1、巨核心Keplar架构GPU(75亿晶体管);2、CUDA 5能带来哪些新特性;3、GPU助力3D渲染与云相结合
黄仁勋首先介绍了CUDA的增长,他表示CUDA的下载已经从2008年的超过15万次到现在已经超过150万次,并且基于CUDA发布的论文远超其他开发环境。他表示,2007年在ISC超级计算大会上只有NVIDIA自己的展台在说CUDA,而2011年的大会则有几十家合作伙伴在说CUDA和NVIDIA GPU计算解决方案。
说完CUDA生态环境,黄仁勋开始介绍NVIDIA目前最具火力的GPU核心:Keplar。他着重介绍了GTX690,这款双核心显卡拥有两颗GK104核心,其CUDA核心数量达到了3072个,并且两颗GPU之间用SLI芯片桥接以保证了最大的协同和带宽。
接下来,黄仁勋演示了GTX690双Keplar核心的强大物理加速和光线追踪的效果。笔者看到,不光是三根水晶柱被打碎的实时效果,还是光线追踪技术里的水滴+logo倒影的实时光线追中效果都非常惊艳。
黄仁勋宣布基于Keplar核心的Tesla众核计算产品发布。包括两款产品:K10和K20,其中K10拥有3倍的单精度浮点提升,1.8倍内存带宽提升;而K20作为高端产品,其双精度浮点性能提升了3倍,并且拥有Hyper-Q等最新技术。Hyper-Q能让GPU同时处理CPU派发的32个计算任务(Fermi只能处理一个)
基于Keplar的Tesla计算卡还改进了动态任务分发机制,从图中可以看到,原来的分发机制是CPU内核对各个CUDA核心做分发。而在Keplar中,NVIDIA采用了GPU来动态分发计算任务给各个CUDA核心,进而减少了CPU占用率,也降低了瓶颈(CPU和CUDA核1对1分发,核心数远少于GPU,会造成等待)
黄仁勋宣布的另一个重要发布:Keplar是世界上首个可用于云计算的GPU,也是首个支持虚拟化的GPU核心,并且可以提供低延迟的远程显示和超高能效特性。对于ipad等设备来说,NVIDIA在后台的大量Tesla计算卡提供的众多CUDA核心可以延伸到手持设备,也就使它们具有了强大的显卡和众核计算能力。
除了介绍桌面云以及后端GPU虚拟化带给手持设备的强大性能之外,黄仁勋还表示实际上GPU虚拟化的另一个重要应用场景是云端游戏。NVIDIA的最新技术Geforce Grid解决了以往云端游戏面临的各种延迟和显示效果问题——下图显示了与传统技术对比的巨大进步。