扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
如今在高性能计算领域混合计算成为新的关键词,位于世界先列的超级计算机有很多都采用了CPU+GPU的混合计算模式,如我国的“天河一号”,GPU计算在其中起到了重要的作用。那么,什么是GPU计算?GPU计算为何能够获得业内的青睐?
什么是GPU?
GPU这个词从1990年便开始使用,对应人们熟知的CPU(中央处理器),GPU指的是显卡上所使用的针对图像处理的处理芯片。GPU虽然发展的日期尚短,但是它一早就具备了多核心运算的优越功能。今天,人们使用的游戏显卡中,以非常廉价的9600gt显卡为例,它具有64个流处理器,我们称它们为cuda处理器,也就是说一个9600gt的GPU它具备着64个运算核心,跟当前最多的8核的CPU对比,足足8倍。如果是像gtx295或者最新的gtx480等,更高达480个运算核心。即便每个核心的工作效率比CPU的低一半,但是这个庞大的数量就足以弥补这些缺陷。
GPU计算和Tesla
随着GPU的日益发展,人们慢慢意识到GPU的真正潜力。2009年,NVIDIA公司正式把cuda的编译模式公开化,让众多编程人员一窥cuda的秘密。NVIDIA也把手上的拳头产品重新包装完善后,推出让业界震惊的tesla工作站。
这个命名为tesla的工作站就是通过高密度集成cuda运算集群,已达到帮助程序开发人员实现利用cuda强大的集群运算模式,解决更高强度的运算工作。例如,空间数据运算,三维空间的高强度物理运算,系统分析和时下流行的动画渲染工作。在这样的新机器推出后,过去很多不可能完成的任务,如今都变得非常轻松。
Nvidia举办的专家聚会当中,就有专家提出了很多著名的例子,如加勒比海盗2中两艘海盗船在巨型漩涡中对战的画面。制作专家指出,当时他们使用的是当时市面最先进的一套渲染农场,估计有20到40个节点左右。他们渲染那段画面中的一帧就耗费了20个小时,一个单帧画面就耗费了一个渲染农场20个小时的时间。然后他又指出,当他使用到GPU运算后,他发现时间至少会有10至15倍的缩减。
另外一个例子,另一个专家在阐述他们制作变形金刚2的制作过程中,里面的一段挖掘金字塔顶部的动画中使用到大量的粒子。而这样的运算量,在过去的CPU运算时代是不可能实现的。最终他们利用GPU运算这一先进技术解决了这个难题。更有专家指出在2012电影中所看见的大量破坏画面,都是依赖GPU云运算得以解决,而使到画面更逼真更宏大。
Tesla工作站是专门针对未来的GPU云运算市场所开发的利器。到底Tesla有什么出众的特点呢?
Tesla工作站基于NVIDIA公司开发的Tesla显卡为中心的超级工作站,真正的主角就是这块tesla显卡。它具有448个cuda运算核心,3G/6G显存,1T的单精度运算速度和0.5T的双精度计算速度。其他的参数大可不必多说,来打个比方,这意味着这块tesla显卡中,具有448个1t运算速度的运算核心一同运算,并且具备3G/6G的显示内存可以供给调用,足够应付各种庞大的运算,如果对应当前的8核CPU的话,那就相当于60个CPU一同工作,相当于30台双CPU的工作站的运算量,根本不用提及现在市面还没有1t的运算速度的CPU销售。
下面是笔者用自己的电脑和单片tesla工作站之间做了一个对比,笔者电脑使用的显卡为一quadro fx1800,电脑的渲染时间为7小时,运算采样值为4096个运算采样。应用Tesla工作站渲染时间为20分钟,运算采样值为8192个采样。对比非常强烈。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者