科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道AMD Istanbul实测:增加两个内核的意义

AMD Istanbul实测:增加两个内核的意义

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

就在成功发布45nm四核处理器之后的6个月,AMD提前发布了代号为“Istanbul”的6核Opteron处理器。Istanbul实际是在Shanghai的基础上增加了两个内核,内存控制器有所增强。更让人印象深刻的是,AMD昨天还展示了主频为2.6 GHz的16核处理器,其能耗仅比6个月前推出的2.7 GHz四核处理器高一点。

来源:ZDNet编译 2009年6月4日

关键字: 皓龙 Xeon 虚拟化 AMD

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共13页)

vApus Mark I:性能关键的虚拟化应用

如果你已经对数据中心实施了虚拟化,那么可能那些非密集型负载也已经实现了虚拟化。接下来呢?虚拟化厂商会积极地鼓励你对性能关键硬件实施虚拟化。你可以通过vSphere 4使用多达8个vCPUs和255 GB RAM,Xenserver 8 vCPU和32 GB RAM。Hyper-V仍然局限在4 vCPU和每个主机最多16个CPU。但是对于Hyper-V R2来说情况有所改变。底线是,如果能够更轻松地实现迁移或者管理的话,对处理密集型应用实施虚拟化还是有很大吸引力的。

这时候就用到了vApus Mark I:一个OLAP、一个DSS和两个密集型Web网站。现在有很多要求苛刻的应用仍然需要运行一年前使用的某些设备。vApus Mark I测试显示了如果实现虚拟化的话会发生什么情况。与之前的基准测试相比,只有一点改变了:我们使用大型页面,因为它通常被认为是最佳策略。性能提升了4%~5%。

我们的其他选择保持不变:如果可能的话,所有虚拟机都具备RVI和EPT;除特定要求外,不使用超线程。

vApus Mark I使用了4个运行4个服务器应用的虚拟机:一个运行在Windows 2008 64位版本上的SQL Server 2008 x64数据库,用我们自主开发的vApus软件进行测试;两个在Windows 2003 R2上运行PHP和IIS的处理密集型MCS eFMS,用我们自主开发的vApus软件进行测试;一个OLTP数据库,用Dominic Giles的Oracle 10G Calling Circle进行测试。

vApus软件运用人为操作来执行虚拟机测试,而不是用一些基准测试算法。首先让我们来看一看在最常用hypervisor——ESX 3.5 Update 4下的测试结果:

如果你只是将Istanbul插入你的虚拟化服务器中,那么你无法知道你运行的是六核还是四核。你可能还记得,主频为2.9 GHz的2389得分为203。让人失望的是,主频为2.6 GHz的六核CPU与主频为2.9 GHz的四核CPU得分没有太大差别。那么问题出在哪里?VMware ESX 3.5默认的是将可用内核分成4个内核大小的组,也就是所谓的单元。目的是为了保证虚拟机总是在同一个单元内,从而保证虚拟机总是在一个节点中。这会确保虚拟机总是使用本地内存(而不需要其他节点的远程内存),更重要的是,缓存总是保持“活动”的。如果维持4个内核大小的默认单元,那么一个或者多个虚拟机将在2路系统中被分割,在不同部分之间进行传输。一旦我们将单元大小从4个内核增加到6个内核,那么情况就完全不同了,丑小鸭变成了白天鹅。六核Opteron与最好的Xeon打成平手!

在这种情况下,Xeon x55xx显得有些相形见绌,因为ESX 3.5 update 4不支持EPT,而且没有针对超线程进行优化。从上面的测试中可以看到,超线程将得分提高了17%。根据我们从OEM厂商方面获得的数据显示,VMmark在ESX 4.0上提高了30%。这表明ESX 4.0能够更好地利用超线程。那么,让我们来看一看ESX 4.0的数据。

Nehalem提高的幅度不大。六核Opteron的性能降低了2%,这是在该基准的错误率范围内的,对最新的Opteron来说仍然是一个很好的结果:表明它与主频为2.66 GHz的Xeon X5550竞争是没有问题的。VMmark结果说明,当服务器上层虚拟机数量大幅增加的时候,最新Xeon Nehalem的优势就显示出来了。所以我们决定在8个虚拟机的环境下进行测试。你很有可能会在一台物理服务器上层整合超过10个性能关键应用,我们我们觉得8个虚拟机就能说明问题。只有一个变化:用于Webportal的内存从4GB减少到2GB,确保基准满足我们在Xeon X5570上设定最高24GB的范围。我们计算出两个相同虚拟机的平均结果(OLAP VM = (OLAP VM1 + OLAP VM5)/2)

可以发现,HT Assist是2路架构的性能“杀手”。有趣的是,随着虚拟机的增加,Xeon X5570的性能优势开始不那么明显。Xeon X5570比双核2435皓龙处理器快大约30%。这也给我们提供了一个为什么VMmark得分为什么这么极端的线索:大量虚拟机可能过于强调交换时间了。但即使是在负载较小的时候,也很难找到超过20个虚拟机位于DP处理器上层。

还有,在测试中,ESX Scheduler在32个vCPU上分配16个逻辑CPU。这比在32个vCPU上分配12个物理CPU容易多了。这可能在六核Opteron上带来时序安排的问题。

所以我们的测试某种程度上“更偏向于”Xeon X5570。

我们将vCPU的数量从4个减少到2个。这就意味着:

-OLAP测试的4个vCPU增加一倍
-OLTP测试的4个vCPU增加一倍
-OLTP测试的2个vCPU增加一倍

或者总共24个vCPU。因此这个测试更倾向于Istanbul处理器。记住,我们的参考数据是基于4 CPU的原始得分。所以我们将参考数据调整为基于2 CPU的原始得分。OLTP和OLAP测试的参考数据保持不变。下面的测试结果与以前你所见的数据是没有可对比性的。这只是为了让你更好地理解我们得出的结果。我们计算出两个相同虚拟机的平均结果(OLAP VM = (OLAP VM1 + OLAP VM5)/2)

结果是,Xeon Nehalem这一次只快了11%。所以记住一点很重要,当谈到MP虚拟机的时候,vCPU数量与Cell大小之间的关系是非常重要的。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章