至顶网›服务器频道 ›X86服务器›英伟达Tesla项目CTO：打造Tesla和Tegra融合架构

英伟达Tesla项目CTO：打造Tesla和Tegra融合架构

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

英伟达公司的Tesla GPU协处理器与CUDA编程环境已经成为席卷超级计算机世界的一场强劲风暴。在媒体采访中，Tesla GPU协处理器部门CTO cott谈到了关于Tesla GPU协处理器与Tegra CPU的更多细节信息。

来源：ZDNetserver频道 2013年4月26日

Tesla与Tegra之间的区别是什么?

记者:在高性能计算领域，Tegra与Tesla的本质区别是什么？哪些因素会促使超级计算机厂商放弃Parker芯片甚至是Logan，转而通过Tegra打造超级计算机？

Scott: Tegra永远不会具备良好的网络接口，因为它并不需要；而且Tegra也不会拥有像Tesla那种级别的子系统内存容量及带宽。在某种情况下，大家可能会在Tegra中获得堆栈式内存，正如我们打算在“Volta”Tesla芯片中实现的效果，但在容量上仍然非常有限。

Tesla则永远无法获得理想的普及度，至少与我们为之投入的大量工程研究及全面解决能力相比还远远不够。然而采用同一套基础架构的开发思路使其足以作为消费级组件产品并用于组建超级计算机。

记者: Tesla产品中所使用的Denver核心到底有多强力？它有能力完全摆脱X86架构的影响吗？

Scott: 这是我们的奋斗目标。单就功能性着眼，ARM ISA与X86 ISA之间其实并无不同。ARM ISA在RISC方面显得更加纯粹，而X86处理器则完全是通过包装而转化为RISC ISA的方案。我很高兴地看到全球大部分用户都承认ARM比X86更具效率优势，但实际上这一结论并不准确。这有点像二阶效应，人们往往喜欢为市场上相对弱势的一方假设一种竞争优势。但平心而论，ARM并不具备什么功耗竞争力。

真正的优势在于，ARM采用开放式架构且具备极高的普及度，越来越多的用户使用它，并由此给产品带来创新与发展的新机遇。纵观技术发展史，支持者多的一方往往能够胜出，也就是所谓“创新者的困境”。我希望ARM在面对英特尔时能够像英特尔当初在RISC与大型机方面那样占得先机。没人敢保证历史会再次重演，但我还得再次强调，普及度高（意味着利润比例较低）、开放且用户群体更大的一方往往能在创新竞赛中获得成功。

记者:您会将未来的InfiniBand端口加入到Tesla方案当中吗？这么做是否能得到满意的结果？您会把ConnectX适配器、完整的交换机、或者像ARM服务器与Calxeda分布式交换机的组合那样为Tesla增添网络功能吗？

Scott: 当然可以。我认为大家都能从网卡提升方面获得可观回报。将路由器也整合进来则有利有弊，因为我们还需要提供创建不同强度网络方案的能力。如果处理器本身并不内置路由器芯片，那么用户则能够轻松按需求构建或庞大或精巧的网络系统。而且加入路由功能之后，我们就需要利用处理器来引导进入与发出的数据包——这些数据进程不会在处理器端结束、也并非以此为起点。这会给处理器带来更多负担，不过只要我们对配置规划得当，其效果也会非常理想。

我不能透露太多目前正在进行的工作内容，但这一切都围绕着整合而进行。我们期望到2020年之前，高性能网络生态系统中不再有第三方供应商的身影。

如果大家关注目前的全球超算五百强，肯定会发现大部分采用以太网系统的设备都处于榜单末尾——其执行效率相当差劲，即使是在Linpack基准测试中也是如此。而在表现突出的高性能计算系统中，我们会看到InfiniBand及定制网络已经成为克雷、SGI、IBM等大厂商的首选。从目前的状况推导可知，QLogic与克雷的网络体系都将被历史所淘汰，原因很简单：英特尔接手了网络业务，而克雷只能选择退出。根据我收集到的信息，BlueGene也将逐渐淡出视野，因为目前BlueGene没有放出任何路线图计划。K计算机所采用的富士通Tofu网络在商业化领域的发展前景也不明朗。SGI目前使用的是定制网络，但我不知道这样的情况还能持续多久。

那么幸存者还有谁？好像只有Mellanox了。Mellanox的突出贡献是什么？基本上，他们成功将至强服务器接驳为计算集群。如果英特尔公司开始打造专有集成网络体系，那么Mellanox公司就算不至于元气大伤——我不想给大家留下误导性结论——但受到威胁肯定是在所难免的。

记者:对此我也深有同感。而且说了这么多，英特尔公司不仅收购了Fulcrum Microsystems、QLogic以及克雷互连技术以避免其为竞争对手所用，而且希望希望将这些方案分解并融入芯片产品及交换机ASIC当中——显然处理器巨头是打算借此实现到2016年数据中心与连接系统业务突破200亿美元营收的目标。

(在采访过程中并没有想到这一点，但英伟达也许可以考虑收购Mellanox以将其收为己用，或者至少保证其在竞争中保持中立态度。)

Scott:我们已经在为缺乏第三方GPU互连网络技术的可能性进行准备。我们也在考虑进军处理器销售市场，而不只是为其它厂商的处理器提供加速辅助。总而言之，我们确实需要一套自己的网络方案。

记者:就像您为DARPA打造的Echelon开发项目？这看起来与克雷公司的“Aries”互连技术非常相似。

Scott: Echelon计划旨在利用集成网卡与充足带宽为处理器提供贯穿设备的全局地址空间支持——本地负载、远程存储以及所有同步流程都能以无缝方式运行于同一芯片或不同芯片的各个核心之间。要实现这一目的，我们需要具备非常紧凑的集成网络结构。没错，我们的目标与Aries一样，希望在网络方案中实现蜻蜓效应（即通过精密配合实现协作目标）。我们的细节有所不同，但确实同样使用蜻蜓拓扑结构。

英伟达的Echelon百亿亿次计算系统

记者:继续说回原先的话题，您是打算以自主研发方式解决问题、还是寄希望于其它厂商的成果？

Scott: 这个问题提得好。其实我们也刚刚开始认真思考这个问题。当我在克雷公司工作时，我跟来自斯坦福大学的Bill Dally共同负责Aries项目，现在我们则双双进入英伟达。Aries路由技术由两位架构师共同打造，我本人和Mike Parker，他现在也在英伟达公司担任高级研究科学家。显然，我们已经具备独立研发的能力。

问题在于，我们该做些什么？对于最终成果的定义，我们还感到有些迷茫。虽然已经有一些思路，抱歉在这里不能透露更多，但我们需要确保为未来的处理器产品提供优秀的网络解决方案，而且很显然网络方案要与处理器更加紧密地耦合在一起。我们也讨论过潜在合作伙伴的问题，因为我们真的不想为网络项目设置独立公司。

记者:不过英伟达公司刚刚公布了视觉运算装置，所以我对您的说法持怀疑态度。但说真的，有时候您可能没有选择。我们可以看看思科公司在面对各服务器供应商争相抢购网络企业以打造自家TAM时的反应，毕竟在系统融合与网络虚拟化的大势之下，每个人都想在新市场中分得一杯羹。摆在思科公司面前的只有两条路，要么利用现有网络业务进军服务器市场，要么干脆被挤出历史舞台。世界总是这么残酷，也许有一天英伟达公司也会面临这样的转折点——不是在高性能系统领域奋力一搏，就是直接被淘汰出局。

关键在于无论做出什么样的决定，务必让方案与企业计算及超大规模云计算运营商——例如Facebook与谷歌——的机制相兼容。不要像IBM那样盲目推出BlueGene/Q方案，却根本没意识到只要针对标准机架进行重新设计并下调价格，这些方案就能成为Hadoop领域的杀手级微服务器。标准机架——或者我猜应该叫开放计算机架？

Scott:首先那是个特例。如果针对高性能计算打造的方案能够广泛作用于通用型数据中心，我们当然会非常振奋。我们也确实考虑过这样的路线。而且从网络角度来看，大部分适用于高性能计算的方案也能服务于规模化数据中心。

谷歌、Amazon、Facebook及其它一些主流企业所采用的系统在规模上甚至超过超级计算机。当他们开始尝试摆脱磁盘并向内存存储迈进，原本并无大碍的网络延迟现在却成了制约性能的关键。他们关心的是全局拥塞与数据交互情况，例如MapReduce任务，而且单独节点的带宽低于高性能计算领域。

但只要建立起正确的网络体系，这些问题都将迎刃而解。数据中心与高性能计算两类网络方案都将拥有良好的全局拥塞控制、出色的分类工作隔离以及理想的全局自适配路由效果——而这一切都将在低延迟环境下实现。

VIP专区

VIP用户

普通用户

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一。

重磅专题

往期文章

英伟达Tesla项目CTO：打造Tesla和Tegra融合架构

业界热点: