至顶网›服务器频道 ›X86服务器›英伟达Tesla项目CTO：打造Tesla和Tegra融合架构

英伟达Tesla项目CTO：打造Tesla和Tegra融合架构

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

英伟达公司的Tesla GPU协处理器与CUDA编程环境已经成为席卷超级计算机世界的一场强劲风暴。在媒体采访中，Tesla GPU协处理器部门CTO cott谈到了关于Tesla GPU协处理器与Tegra CPU的更多细节信息。

来源：ZDNetserver频道 2013年4月26日

ZDNet至顶网服务器频道 04月26日消息：俗话说，有心栽花花不发、无心插柳柳成荫。英伟达公司联合创始人兼CEO黄仁勋就很好地诠释了这句俗语。当初黄仁勋表示，不会进军超级计算领域，为3D游戏玩家提供出色的显卡才是该公司的运营目标。然而一晃二十年过去，英伟达公司的Tesla GPU协处理器与CUDA编程环境已经成为席卷超级计算机世界的一股强劲风暴。

大约两年前，超级计算机制造商克雷公司CTO Steve Scott——数代超级计算机与互联技术的设计者——加入了英伟达，并在Tesla GPU协处理器部门继续担任CTO一职。

在一次媒体采访中，Scott谈到了关于Tesla GPU协处理器与Tegra CPU的更多细节信息，后者于一个月之前的GPU技术大会上才刚刚公布。以下为访谈实录。

记者:我们希望了解GPU计算路线图、Denver ARM核心项目、服务器与连接以及您在这一领域所扮演的角色。

Steve Scott:黄仁勋先生已经就此做出过说明，但事实上，“Logan”Tegra的功能诉求也将通过GPU实现。我们关注的是Tegra与Tesla之间的功能过渡方案。

失去GeForce的支持，我们根本无法真正实现Tesla项目的预期效果。高性能计算这块市场还太小，不足以支撑起我们在开发具备强大竞争力的处理器时需要投入的庞大资源。这也是克雷公司放弃处理器开发甚至最近决定放弃互连技术的原因——高性能计算的蛋糕还未成规模。因此，Tesla项目已经完全转由GeForce方案实现。目前最酷的成果是，我们正在努力以GeForce为起点向Tesla延伸、并最终过渡到Tegra。所有GPU计算以及所有相关软件——例如CUDA、OpenACC及其它此类软件堆栈——如今已经出现在手机、平板设备乃至笔记本电脑等多种平台上。而在另一方面，Tesla与Tegra之间的差异也开始逐渐淡化，这是因为我们开始尝试将CPU整合到Tesla当中。

记者:二者会严格遵循项目名称来使用Tegra与Tesla处理器吗？或者说有可能采用专为移动及服务器设备打造的Denver核心衍生方案？

Scott:我们的Denver项目专注于打造一款高性能ARM v8处理器。我们的Denver 64位ARM核心将比目前大家能从ARM公司买到的任何产品都更加强劲。我们仍将推出采用ARM核心的Tegra处理器，正如我们目前推出的Cortex-A9核心，但Denver将成为高端产品的标准配置。

对于获得认证的架构，我始终严格遵循这样的原则：我们可以通过调整来改变ARM核心的性能，但绝不可能轻易改变其设计架构。一切工作必须符合ISA标准，这方面的要求非常严格。

记者:您也不能对ISA做出实质性变动？

Scott:不行。我们可以添加系统芯片功能、可以加入视频转码器、甚至可以使用不同的网络接口，但指令集必须采用由ARM核准的ISA——这一底线无法动摇。也就是说，我们可以对任何软件进行编译并使其运行在任何ARM核心上，这样就很好了。

记者:那么我们该如何看待Tesla与Tegra的发展前景？Tesla会永远存在吗，Tegra会不会走上体积更大、速度更快的路线？

Scott:作为Tesla部门的CTO，我当然希望是这样。目前我还没有放弃Tesla的明确打算。但这两个系列的产品没必要合并，我们只是打算最终推出一套融合架构。这真的是前所未有的情况。纵观历史，我们会发现打造消费级处理器与开发超级计算机处理器所遵循的是完全不同的路线。大家可以回顾当初的Cray 1、Motorola 6800或者MOS 6502，它们简直是一天一个变化。甚至就在五年前它们还与如今完全不同。

但现在每个人都会受到供电能力的制约——对于普通的手机用户来说，最重要的关注对象在于能源使用效率，因为手机电池的功率只有一瓦；而在价值上亿美元的超级计算机上，功耗性能比则成为首要考量对象。因为用电成本始终处于飙升状态。因此，未来打造超级计算机的正确方式是采用大量功耗性能比更高的小型核心。只有这样我们才能获得理想的能源使用效率。现在已经没人愿意为超级计算机开发复杂的处理器了，这样会导致能源使用率低下。

所以问题就变成：我们到底是要用很多小型核心，还是采用100个核心、或配备上千个核心。

记者:目前您已经在GPU的差异化方面进行了大量工作。您以规模化方式增加或减少CUDA核心、SM以及内存等配置的数量；并决定每款产品中各项功能的开启与关闭情况——例如到底采用虚拟化、动态并行还是Hyper-Q，采用单精度还是双精度运算等等。那么Tegra与Tesla之间是否存在类似的差异化设定？

Scott:两者的差异由边缘配置决定——例如采用哪种网络接口、拥有多大内存带宽、是否需要ECC（即错误检查及纠正功能）、需不需要处理高吞吐量的双精度浮点运算等。在高性能计算领域，这些问题的答案都是肯定的，而在移动方面，这些问题的答案又是否定的。但单就架构而言——这意味着为了提升单线程性能而采用一些重量级核心，再出于能耗考虑接入大量小型核心——二者其实是一致的。

因此我们现在可以开发Maxwell系列GPU并准备将其纳入Tesla产品线，而Tegra处理器方面则会迎来Parker系列。正如我们目前所制造的GK104、GK107以及GK110（名称皆为库存编号），三款同系列产品采用同一种基础架构。但在动态并行方面我们绝不会让步，未来推出的任何一款Tesla GPU都将搭配这项技术，虽然其最初是被应用于Tesla K20所使用的GK100中。(Scott还不知道动态并行技术何时才会被添加到未来的Tegra CPU-GPU混合处理器中。)

重点在于，一旦我们让Tegra成为计算工具、整合GPU核心并拥有同样的基础架构，我们也就具备了实现 “从手机到超级计算机”架构统一承诺的前提。这意味着我们将拥有更庞大的架构营收保障，从而为Tesla提供发展基础。

记者:就目前来看，Tesla基本是一块经过少量调整、专门用于服务器及工作站的GeForce显卡。但展望未来，Tesla与Tegra之间仍然会存在一些不同之处，您是打算把CPU与GPU同时放在同一块芯片上。

Scott:二者并不一定要放在同一块芯片上。只要为它们提供定制接口，就能实现同样的效果。

记者:英特尔公司已经把至强E3与高清显卡整合在一起。英特尔会根据情况选择开启或关闭显卡功能，从您的角度出发则是开启或关闭CPU功能，这取决于产品到底是用在工作站上还是服务器上。

Scott:这最终取决于ARM是否能在游戏领域成功取得优势，大家不妨想象游戏设备在未来的发展方向——利用ARM加GPU来取代X86加GPU。

记者:这段时间我一直在思考您进军控制台业务，从而进入特定服务器，最终登陆PC机的决定——无论这在未来意味着什么——但却单单回避了智能手机与平板设备。

Scott:重点在于，我们可以在同样的架构基础上实现目前的所有业务。但我们将继续与英特尔与AMD处理器进行互操作——这个前提非常重要，而且我们也将继续坚持这一路线——所以功能重叠是不可避免的。但大家可以想象未来X86处理器将逐渐消失在历史舞台当中，因为我们拥有了集成化ARM处理器。

VIP专区

VIP用户

普通用户

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一。

重磅专题

往期文章

英伟达Tesla项目CTO：打造Tesla和Tegra融合架构

业界热点: