扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共4页)
2012年3月16日,惠普在北京正式发布了其耗资3亿美元、耗时两年的Voyager计划的研究成果——ProLiant Gen8服务器,它以涵盖整个惠普融合基础设施的全新系统架构——HP ProActive Insight为核心,引发了x86服务器在核心性能架构以外的自主式生命周期管理的创新。而在3个月之后,它又迎来了新的成员——采用AMD皓龙6200(Opteron 6200)系列处理器的Gen8服务器,从而使其产品线更为完整,为用户又提供了一个新的且强有力的选择。
Opteron 6200处理器新特性简介
在深入了解AMD平台Gen 8服务器之前,我想有必要对于Opteron 6200处理器进行一个必要的介绍,毕竟这是其相对于英特尔平台Gen8服务器最大的不同。Opteron 6200处理的一大亮点在于其采用了崭新设计的“推土机”(Bulldozer)核心架构,有关Bulldozer处理器架构的介绍,已经有很多了,但为了文章的完整性,我们今天也在此做一简单的回顾与介绍,首先要明确的是,从Bulldozer开始,传统意义上的“CPU核心”的概念已经有了变化。
Bulldozer的“模块”架构图,可以看作是两个整数处理核心共享一个浮点处理单元的设计 ,因为日常的处理运算中,更多的是整数处理,所以这就变向的等于在一个模块可以同时处理两个整数处理线程,而无需共享处理管线
AMD当初开发Bulldozer架构的初衷在于,经调查发现日常的IT应用主要集中于整数运算,而浮点运算相对较少。为了提高多线程处理的性能,AMD 设想可不可以用2+1的方式来解决,即两个整数处理核心+1个浮点处理单元,以组成一个新架构的处理单元——Module(模块)。 众所周知,在多线程处理方面,英特尔最早提出了Hyper-Threading(超线程)的理念,可以使操作系统或者应用软件的多个线程,同时运行于一个 超线程处理器上,其内部的两个逻辑处理器共享一组处理器执行单元。而AMD CPU的两个线程使用各自的单元,但两个线程是共享命令解码器和浮点运算等资源的。因为是整数运算,所有线程之间没有冲突,因此吞吐量有所提高。
从芯片级别看Bulldozer模块,每个模块拥有自己的L2缓存,L3缓存则为晶片级共享
Opteron 6200与4200的晶片设计图,4200由单晶片(功能单元略有不同)构成,最多4个模块(8核心),6200由两块该晶片组成,最多8个模块(16个核心)
由于这种2+1的核心设计,在Bulldozer的架构中,其核心(Core)的概念已经与传统认识有了较大的不同,单一的核心并不是一个具备完整功能的处理单位,所以AMD一直在用Bulldozer Module来表示Bulldozer处理器的处理单元,所以在后文的介绍中,对于Opteron 6200我们也将用模块和核心两个概念表述——在这里,核心是指组成模块中的整数处理单元,它们共享一个弹性浮点处理单元(Flex FP)。
Opteron 6200的内部架构图,相当于用两块4200组成,两个芯片之间由HyperTransport总线互联
在Bulldozer架构中,非常值得一提的是由两个整数处理核心共享的Flex FP处理单元与新增加的独家指令集。这一Flex FP由两个128bit FMAC(Fused Multiply–Add Capability,混合乘加)处理单元组成,之所以称为弹性(Flex),是因为这两个单元可以各自独立,为每个整数核心提供独享的128bit浮点 处理单元(此时可以认为是两个具备有整数运算+128bit浮点运算单元的处理核心,组成了Bulldozer Module),也可以组合成一个256bit的浮点处理单元为一个模块提供服务,这其实给编程人员提供了很好的弹性,但也预示着对现有的应用需要进一步的优化。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者