科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道服务器组件甲骨文公布Sparc M6芯片 目标直指超大型设备

甲骨文公布Sparc M6芯片 目标直指超大型设备

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

全新Sparc M6处理器日前在本届由斯坦福大学举办的Hot Chips大会上亮相,这款产品的公布标志着甲骨文意欲进军超大型设备市场,从而与业界前辈蓝色巨人展开竞争。

作者:ZDNetserver频道 来源:ZDNetserver频道 2013年8月30日

关键字: 甲骨文 SPARC

  • 评论
  • 分享微博
  • 分享邮件

ZDNet至顶网服务器频道 08月30日 编译:全新Sparc M6处理器日前在本届由斯坦福大学举办的Hot Chips大会上亮相,这款产品的公布标志着甲骨文意欲进军超大型设备市场,从而与业界前辈蓝色巨人展开竞争。

甲骨文的举动正好迎合了系统市场的迫切需要,特别是为客户提供必要的巨量主内存。此外,随着时间推移大内存计算方案正变得越来越重要,这与当年RISC/Unix服务器业务无比辉煌的岁月颇有相似之处——当然对甲骨文而言也是个好消息。

按目前的形势看,甲骨文似乎终于打算为Sun Microsystems公司组建一个体面的微处理器与互连技术开发团队。事实上,多年来Sun公司的老员工们一直忍辱求存,如今他们的创意与灵感最终将在Sparc M6设备上得到体现。值得一提的是,早在十五年前打造UltraSparc-III时,这些创意与灵感就已经初具规模。

不过命运多舛的“Millennium”UltraSparc-V与“Rock”UltraSparc-RK项目的接连惨败,也让芯片开发团队的勃勃野心付之东流,但甲骨文掌控下的微电子业务部门却保持坚挺,为我们带来三款处理器方案以及日益精密的互连与系统扩展机制。

在此次Hot Chips大会上亮相的Sparc M6系统是Sparc家族中的第四位成员。

对于渴望更多备选方案或者热爱大型设备的系统爱好者来说,甲骨文这次带来了真正令人欣喜的工程技术回馈。目前还不清楚甲骨文是否会真正制造并销售这些系统,特别是在它们只能运行Solaris(而非Linux或者Windows)的情况下。不过每一款设备都能够扩展至96插槽,这一特性对于渴求超大内存地址空间以支持业务应用程序的政府机关与大型企业来说,无疑极具吸引力。

虽然作为最新Sparc T4、T5、M5以及M6处理器灵魂的S3核心在性能表现上很难与至强、Power、System z甚至安腾(没错,就是安腾)相比肩,但S3核心仍然有能力在很多工作负载领域带来出色的发挥。

甲骨文Sparc M6芯片 目标直指超大型设备甲骨文M6处理器

因此,如果甲骨文有意积极推动Sparc M6系统,则必须向客户们传达这样一种观点:Sparc M6是一套比至强Exadata集群更理想的系统,甚至比四插槽至强E7设备更适合进行内存内数据库托管。

甲骨文到底该不该选择这样的宣传方针?我们认为Sparc M设备家族(指那些由甲骨文自家生产的设备,与富士通的同名产品无关,因为在双方的几代产品共享同一套设计平台之后,后者的最新方案已经开始采用完全不同的处理器以及互连机制)很可能成为Sun重返大型设备领域的最佳跳板。

换言之,如果Sparc M6与Bixby互连之间的协作效果真如宣传中那般出色,那么偏爱硬件的甲骨文完全可以放弃Exadata集群,并将注意力集中在运行于大型设备当中的单数据库镜像身上。甲骨文并不需要英特尔的帮助,他们只需要像Sun在互联网崛起之初时那样销售Sparc与Solaris。

当然,甲骨文也可能不会选择这种路线。甲骨文已经在自己的Exa服务器产品线上投入太多资源,除非公司营销人员吃错了药跑去在数据库、Web应用程序以及分析工作负载等领域大力推广Sparc M服务器,但这样一来在Exa设备身上的所有工程研发努力都会变得毫无意义。

Sparc T与M芯片在甲骨文收购Sun后的三年中获得长足发展,而且已经拥有属于自己的独立体系。下面我们就通过图表一起了解四款处理器的基本参数与性能表现:

甲骨文Sparc M6芯片 目标直指超大型设备最新Sparc T及M系列芯片参数比较

Sparc T系列产品专门针对入门级与中端系统,插槽数量范围在一个到八个之间,每个插槽的最高内存容量为512GB。Sparc T5采用28纳米制造工艺——目前甲骨文推出的所有服务器芯片与互连芯片都由台湾半导体制造公司(又名台积电公司)负责生产,而Sun则选择了德州仪表作为其晶圆代工厂——而且允许甲骨文在同一块芯片上容纳16个计算核心与128线程。

比较Sparc M5与M6前后两代芯片,甲骨文并没有在28纳米制造工艺方面做出什么变动,但却通过增加芯片尺寸将核心数量翻倍。不过需要再次强调,M系列处理器虽然仍基于八线程S3核心,但每块芯片上的核心数量却有所不同,而且配备更大的三级缓存与主内存,旨在支持多出来的核心真正发挥功效。由于采用了与Sparc T5类似的芯片SMP,M5与M6芯片能够通过无缝化对接机制在八插槽基板上汇聚成一套单独系统方案。在M6设备中,Bixby互连机制将插槽数量由原先的32个提升至如今的96个——进化幅度相当惊人。

需要提醒大家的是,S3核心拥有双发射、乱序执行架构。每个核心借助Sun/甲骨文的模拟多线程技术——用于对流水线进行虚拟化并使操作系统将其作为八线程机制使用——实现八线程。

该芯片的线程(即虚拟流水线)能够进行动态分配,这意味着拥有较高优先级的指令——甲骨文称其为关键性线程——能够尽可能占用更多资源,甚至使用计算核心所能提供的全部资源。事实上,单个S3核心、芯片上的多个S3核心或者整套系统能够通过设置为关键性线程提供与单线程设备相信的运行效果。这种动态线程机制最早出现在Sparc T4当中,并给Sparc服务器产品线的实用性带来巨大影响;许多老式Sparc/Solaris应用程序都是资源占用大户,而且并没能很好地利用全部线程。

甲骨文Sparc M6芯片 目标直指超大型设备Sparc M6芯片示意图

M6芯片上的S3核心拥有16KB一级指令与数据缓存,这样的容量对于现代标准来说显得有些孱弱;二级缓存为128KB,同样略显紧张。M6芯片的板载三级缓存为48MB,通过分享机制提供给处理器上的十二个核心。同样,由于核心数量的增加,大家可能希望甲骨文也能将三级缓存的容量翻倍——不过作为一块容纳着42.7亿个晶体管的芯片,M6已经堪称怪兽级方案。

通过合理的猜测,我们认为Sparc M7可能会将制作工艺进一步缩小至20纳米,而甲骨文则可能会专注于提高时钟速率、增加缓存容量并添加更多芯片加速器,从而让M系列芯片在与Power及至强等高端服务器竞争对手的较量中占得先机。话说回来,作为一套拥有96个插槽、1152个计算核心、9216个线程并搭配全扩展Bixby互连机制的单独系统方案,甲骨文根本不需要在可扩展性方面再做什么努力——当然,除非这些超大规模数据中心运营商与政府机构提出明确要求。

Sparc M6芯片拥有四个DDR3内存控制器,每一个都配备两块内存缓冲芯片,并提供两条内存通道用于支持DDR3内存条。总体来说,M6拥有16条内存通道与32个内存槽,在使用单条32GB内存时,我们能够在单一插槽中拥有1TGB内存容量。这意味着顶级Sparc M6服务器能够利用高达96TB的庞大内存为1152个计算核心提供辅助。

M6芯片上的十二个计算核心能够通过12x5交叉互连机制接驳在一起,其中四条通道将核心与四个12MB三级缓存分区中的每一个相连;第五条通道则用于连接计算核心与I/O子系统(提供两个PCI-Express 3.0接口)。这些控制器各支持两个x8PCI流量端口。芯片还拥有七条可扩展连接,旨在以无缝化方式实现SMP互连,即实现集群内各个插槽的彼此连通。

“这只能实现小规模连通性,无法进一步扩大。”甲骨文公司高级首席硬件工程师Ali Vahidsafa解释道,他也是M6项目的设计负责人。“很明显,大规模连通非常复杂、难以实现。”

这并不是玩笑,不过甲骨文仍然希望在这方面做出尝试。

Sparc M6芯片还拥有七条统一性连接,这些连接延伸至Bixby互连芯片端,旨在实现超越八路SMP的扩展效果,将多台四路设备聚合为一套巨大的NUMA网络。根据所使用Bixby芯片的具体数量,甲骨文能够创建出拥有16、24、32、48、64乃至96个插槽的设备,而且各种配置都使用一套单独的共享内存空间。Sparc M6芯片具有惊人的4.1Tb每秒总传统带宽,完全能够满足可扩展连接与统一性连接端口的需求。

下面就是配备了12块Bixby互连芯片的32插槽设备示意图:

甲骨文Sparc M6芯片 目标直指超大型设备M6服务器的Bixby互连体系

Bixby互连机制并没有在插槽层面上进行一一对接,因此大家可以根据需求逐步建立起规模庞大的设备体系,并通过多次跳转实现由一个节点向另一套系统的连通。(这套方案与Silicon Graphics公司的NUMAlink 6互连机制没什么不同,只是后者的方案利用至强E5芯片、克雷公司开发但现已归英特尔所有的‘Aries’XC互连机制或者富士通的‘Tofu’互连机制,但三者都没有采取在不同节点之间共享内存的方案。如果用户需要进行扩展,则只能通过跳转实现。)

Bixby统一交换芯片会在给定系统中为所有处理器提供三级缓存目录,而每一块处理器所发出的内存请求都必须通过统一性连接在系统中查寻合适的处理器SMP组,然后SMP组中的处理器插槽即可获得所需内存。接下来交换芯片会通过跳转帮助设备分区找到最近的Bixby芯片连接(并非直接跳转,而是通过统一连接、扩展连接、再回到统一连接的方式),而后利用最合适的扩展连接获取三级缓存内的数据或者使用与插槽关联的本地主内存数据(即在内存或者缓存中检索数据)。

这套设备相当于SMP服务器的NUMA嵌套体系。为了缓解由跳转带来的高延迟现象,甲骨文公司对Bixby交换机进行了深度配置,从而使其拥有大量带宽资源。扩展连接拥有四条流量通道,双工带宽达到12Gb每秒。而在上图所示的32路设备中,每个Bixby交换机通过8路SMP与八个插槽中的四个相连,因此任何处理器都能在最少一次、最多四次跳转后接入另一套系统。

甲骨文公司已经投放市场的Sparc M5-32设备使用12块Bixby芯片,能够将硬件域划分为四个物理分区(为设备中的每套SMP分配一个),统一连接的总传输带宽为3.1TB每秒,扩展连接的总传输带宽为1.5TB每秒。

目前尚不清楚甲骨文将在何时推出Sparc M6处理器或者搭载这款处理器的设备。不过Vahidsafa明确表示甲骨文打算在一套单独系统中同时支持Sparc M5与M6处理器,从而帮助已经购买了前续高端Sparc机型的客户实现升级。Sun公司当初也使用过这样的处理方式,相比之下IBM与英特尔则不允许各自Power及至强芯片/芯片组与早期版本并行协作。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章