科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道高性能计算NVIDIA:Tesla CUDA是最好的HPC工具!

NVIDIA:Tesla CUDA是最好的HPC工具!

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

GPU通用计算已经是一个不可阻挡的潮流,那么在2010年里,GPU通用计算又将如何发展呢?为此我们专访了在GPGPU方面走在业界前端的NVIDIA公司Tesla产品总监Sumit Gupata先生,就相关的热点话题进行了深入的交流。

作者:赵效民 来源:ZDNet【原创】 2010年3月15日

关键字: NVIDIA GPU Fermi Tesla

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共8页)

NVIDIA的GPU计算产品家族——我们在革新,但对手没有!

NVIDIA在GPU计算方面的主力产品就是Tesla,它于2007年6月21日正式宣布。现在市面上所销售的基于NVIDIA的显卡,只要支持CUDA就可以用到GPU计算的能力,包括GeForce和Quadro,Tesla与这两者的主要区别就是它取消了显示输出的模块,从而只专注于GPU计算。

目前在市场上销售的Tesla产品线与解决方案,算是Tesla家族的第二代产品

Tesla产品线可分为两大部分,一个面向数据中心级机房应用的HPC系统,一个是面向基于工作站的人个HPC系统,在数据中心级产品方面又分为GPU模块与专用的GPU服务器,而工作站所使用的就是插卡形式的Tesla,当然它们不能用于显示输出。

Tesla的模块除了可装进机架服务器外,还可以被刀片服务器所采用,但由于刀片还没有像机架服务器那样标准化,所以这更多的是相关厂商的自己发挥,当然NVIDIA的协作是必不可少的。上图中就是法国著名的HPC厂商Bull所开发的采用Tesla M1060模块的7U刀片服务器,一个刀片有一个GPU模块和两个x86处理器(至强5500),Sumit Gupata表示,类似的产品将在今年大量出现,但现在还不便多说,等到第二季度会给大家一个惊喜

不过,NVIDIA今年推广的重点肯定是新一代的Fermi Tesla家族,也可称为第三代Tesla。当我问到在2009年11月的TOP500排名中,只有一套采用Tesla,那么在2010年时又会有多少时?Sumit Gupata笑到,“都在等Fermi。这个很难说,等11月份的TOP 500单子下来吧,预计会占25%(125套左右),但只是预测。不过你可以想一下,基于Fermi的GPU会让整个系统的性能提高10倍,对于500强公司来说,想都不用想,肯定会用Fermi。”

那么Fermi的亮点又有哪些呢?这方面其实有很多文章介绍过了,在此我们只做简要的提炼。

基于Fermi架构的GPU主要特点

Fermi的不少改进都可以看作是针对企业级GPU计算的,比如增加了L1与L2的数据缓存、内外部的内存ECC功能(这两点对于企业计算非常重要)以及最大可达1TB的内存寻址空间,并且它重点加强了双精度浮点运算的性能,较第二代Tesla有了巨大的提升。而最终的产品也与第二代的Tesla一样,分为数据中心与工作站用两个产品线。

Tesla数据中心产品线的路线图

Tesla工作站产品线的路线图

与去年NVIDIA所公布的路线图相比,基于Fermi的Tesla本来是最先亮相的Fermi产品,但现在却推迟到了第二季度,最高端的型号则要等到第三季度。这一现象也不得不让人再次提起那个敏感的问题:NVIDIA跟对手ATI相比,在GPU核心设计上走了两个不同的方向,NVIDIA在做一个功能比较全面的核心设计,性能强大,但比较复杂,核心数量也无法迅速的增加。AMD走的是一个比较轻量级的功能简化的核心设计,单核心性能并不强,但能够很方便的通过堆积核心数量来提升性能。因此NVIDIA这种更强大更复杂的核心设计理念,会不会给自己带来相对来说比较沉重的压力?比如设计的难度和制造的难度。从而最终影响了产品的上市进度?

对此,Sumit Gupata并没有正面的回答,但他强调,“ATI的产品是去年11月上市的,Fermi是今年正准备出货。但不管怎么样,相比之下,我们还是创造了历史记录,产品销售上相对来说还是非常好的。为什么这么说呢?首先游戏、图形市场已经发生了巨大的变化,它不仅仅是做一些简单的三角形或者数量的模拟。未来的游戏或者图形更多的会关注物理的模拟,一些真正的图形,还有光线的追踪。一些软件包可以帮助提供更好的解决方案。我们可以预测未来会有怎样的变化,这也是为什么我们正在采取一系列的步骤来应对未来的变化。但是AMD这方面还是跟以前一样,没什么太大的变化。”

的确,在DX11时代落后对手如此之久让业界对NVIDIA的状态和发展方向有了疑问,不过Sumit Gupata认为这是架构革新所必须要面对的一种代价。“我也读到一些媒体的文章,NVIDIA现在不关注游戏了,更多关注的是Fermi。实际上不是这样的,因为游戏本身也是一种运算。但大家可能没有意识到,光线追踪它用的是L1和L2的缓存。所以这个架构不仅仅是用于HPC,也是用于游戏的。相比之下,AMD的核心架构并没有革新。”

基于Fermi的Tesla与英特尔即将发布的Westmere-EP(至强5600)系统的性能对比

就性能方面,Fermi至少在计算性能方面有了长足的进展,与最新一代x86处理器Westmere-EP(至强5600)相比,双精度浮点性能超过了12.5倍,而第二代Tesla的双精度浮点性能只有Westmere-EP的2倍多。相信这也是众多HPC客户对Fermi翘首以待的一个重要原因吧。

另外,Fermi Tesla的延期还可能预示着新的功能与技术的加入,Sumit Gupata表示,NVIDIA已经找到了方便扩展内存的办法。我就此为问到是否会采用DIMM的形式来扩展内存?未来会不会考虑采用串行内存技术来代替现有的GDDR内存?Sumit Gupata只是淡淡一笑,“我现在还不便多说什么,相信很快就会有相关的信息透露出来,不过可以肯定的是我们仍将采用DDR内存,而不会使用串行内存技术。”

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章