扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共10页)
内存与缓存对于处理器的性能有着重要的作用,基本上第一代新处理器都会在这两点上做文章,而POWER7在这方面的改进也非常大。
IBM对于eDRAM比较偏爱,在IBM看来,eDRAM在性能、带宽、能耗方面达到了一种理想的平衡,它的性能(带宽、延迟)虽然不如SRAM,但所需的晶体管数量也要少很多,所以在能耗与成本方面也更为出色。因此,可以在有限的晶体管数量下,提供更大的缓存容量和更平衡的表现
在POWER7之前,POWER4/5/6也是采用了eDRAM三级缓存,但是在片外的,并不与处理核心融为一体。而随着CPU核心数量的提升,CPU插槽的引脚数量已经很难满足CPU核心与片外的缓存相连,因此这次在POWER7中,将eDRAM三级缓存移到了芯片内部,从而也成为了首个使用片内eDRAM三级缓存的处理器。
POWER7处理器的芯片结构布局,每个核心都有专属L3缓存(Fast L3 Region),容量4MB
POWER7的L3缓存设计,IBM采用了一种被称为Fluid(流动)的混合L3缓存结构
eDRAM的性能介于传统的SRAM缓存与SDRAM内存之间,延迟性能比本地内存低3倍,不过IBM为POWER7的每个核心都划定了自己的专属L3缓存区,即Fast Local L3 Region,这个区域的容量为4MB,8个核心正好是32MB。每个核心访问自己的专属缓存里的延迟比整体的L3缓存延迟还要低5倍,并且L3缓存中的容量可以根据情况迅速的克隆至多个核心的专属区,以方便多核心的共享访问。
POWER7的L3缓存也可以在某种情况下被单个核心所独享
POWER7的三级缓存的另一个特点就是,每个核心虽然有自己的专属缓存区,但当有些核心未使用时,它们所对应的专属缓存区将会共享,如果只有一个核心工作,那就意味着它的L3缓存将达到32MB的容量。当然,访问自有专属缓存区之外的三级缓存的速度将会降低,但容量的增加是不可比拟的。
谈完L3缓存,再来看看L2缓存。与POWER6相比,POWER7的L2缓存的容量只有它的1/16,不过按IBM的说法它非常的快。而且L3缓存本身就在片上,而POWER6的L3缓存在片外,工作主频是POWER6主频的一半,所以里外对比,POWER7的L3缓存的效率显然更高,这也让L2缓存的压力大大降低。
POWER7的整体缓存设计
POWER7中的L2缓存(L2 Turbo Cache)的延迟比每个核心专属的L3缓存还要低3倍,将有效的降低L3缓存的功耗并提高性能,而从总体的缓存设计上,我们能看出来,只有到了POWER7这一代,才真正开始了传统快速SRAM与eDRAM在缓存架构中的平滑结合
POWER7的内存架构设计
POWER7的内存采用了业界主流的DDR3内存,CPU内置两个内存控制器,不过内存控制器并不是与内存DIMM直接打交道,而是通过一个高级缓冲芯片(ABC,Advanced Buffer Chip)访问DDR3内存,每个控制器有4个ABC通道。这个ABC有点类似于FB-DIMM上的高级内存缓冲器(AMB),与内存控制器之间应该是以串行总线相连,每个通道的数据位宽是16bit,传输率为6.4GT/s,这样8个通道的数据带宽就是102.4GB/s。而ABC也对应着8个DDR3通道,最高规格为DDR3-1600,目前来看,每个DDR3通道可容纳最多4条DIMM,以DDR3-1600计算,8个通道的带宽也正好是102.4GB/s,但是可能是由于ABC的限制,目前只支持到DDR3-1066MHz,总带宽为68.2GB/s。在容量方面,以单DIMM 8GB的容量计算,单颗POWER7的内存容量为256GB,平均每核心32GB。与POWER6相比,POWER7的内存带宽提高了一倍(POWER6最高支持DDR2-800),不过由于POWER7的核心数量提高,所以相对于POWER6每核心最多48GB的内存容量,有所降低。
另外,POWER7的内存架构也支持高级的电源管理和RAS特性,这一点将在下文进一步介绍。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者