扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共13页)
vApus Mark I:性能关键的虚拟化应用
如果你已经对数据中心实施了虚拟化,那么可能那些非密集型负载也已经实现了虚拟化。接下来呢?虚拟化厂商会积极地鼓励你对性能关键硬件实施虚拟化。你可以通过vSphere 4使用多达8个vCPUs和255 GB RAM,Xenserver 8 vCPU和32 GB RAM。Hyper-V仍然局限在4 vCPU和每个主机最多16个CPU。但是对于Hyper-V R2来说情况有所改变。底线是,如果能够更轻松地实现迁移或者管理的话,对处理密集型应用实施虚拟化还是有很大吸引力的。
这时候就用到了vApus Mark I:一个OLAP、一个DSS和两个密集型Web网站。现在有很多要求苛刻的应用仍然需要运行一年前使用的某些设备。vApus Mark I测试显示了如果实现虚拟化的话会发生什么情况。与之前的基准测试相比,只有一点改变了:我们使用大型页面,因为它通常被认为是最佳策略。性能提升了4%~5%。
我们的其他选择保持不变:如果可能的话,所有虚拟机都具备RVI和EPT;除特定要求外,不使用超线程。
vApus Mark I使用了4个运行4个服务器应用的虚拟机:一个运行在Windows 2008 64位版本上的SQL Server 2008 x64数据库,用我们自主开发的vApus软件进行测试;两个在Windows 2003 R2上运行PHP和IIS的处理密集型MCS eFMS,用我们自主开发的vApus软件进行测试;一个OLTP数据库,用Dominic Giles的Oracle 10G Calling Circle进行测试。
vApus软件运用人为操作来执行虚拟机测试,而不是用一些基准测试算法。首先让我们来看一看在最常用hypervisor——ESX 3.5 Update 4下的测试结果:
如果你只是将Istanbul插入你的虚拟化服务器中,那么你无法知道你运行的是六核还是四核。你可能还记得,主频为2.9 GHz的2389得分为203。让人失望的是,主频为2.6 GHz的六核CPU与主频为2.9 GHz的四核CPU得分没有太大差别。那么问题出在哪里?VMware ESX 3.5默认的是将可用内核分成4个内核大小的组,也就是所谓的单元。目的是为了保证虚拟机总是在同一个单元内,从而保证虚拟机总是在一个节点中。这会确保虚拟机总是使用本地内存(而不需要其他节点的远程内存),更重要的是,缓存总是保持“活动”的。如果维持4个内核大小的默认单元,那么一个或者多个虚拟机将在2路系统中被分割,在不同部分之间进行传输。一旦我们将单元大小从4个内核增加到6个内核,那么情况就完全不同了,丑小鸭变成了白天鹅。六核Opteron与最好的Xeon打成平手!
在这种情况下,Xeon x55xx显得有些相形见绌,因为ESX 3.5 update 4不支持EPT,而且没有针对超线程进行优化。从上面的测试中可以看到,超线程将得分提高了17%。根据我们从OEM厂商方面获得的数据显示,VMmark在ESX 4.0上提高了30%。这表明ESX 4.0能够更好地利用超线程。那么,让我们来看一看ESX 4.0的数据。
Nehalem提高的幅度不大。六核Opteron的性能降低了2%,这是在该基准的错误率范围内的,对最新的Opteron来说仍然是一个很好的结果:表明它与主频为2.66 GHz的Xeon X5550竞争是没有问题的。VMmark结果说明,当服务器上层虚拟机数量大幅增加的时候,最新Xeon Nehalem的优势就显示出来了。所以我们决定在8个虚拟机的环境下进行测试。你很有可能会在一台物理服务器上层整合超过10个性能关键应用,我们我们觉得8个虚拟机就能说明问题。只有一个变化:用于Webportal的内存从4GB减少到2GB,确保基准满足我们在Xeon X5570上设定最高24GB的范围。我们计算出两个相同虚拟机的平均结果(OLAP VM = (OLAP VM1 + OLAP VM5)/2)
可以发现,HT Assist是2路架构的性能“杀手”。有趣的是,随着虚拟机的增加,Xeon X5570的性能优势开始不那么明显。Xeon X5570比双核2435皓龙处理器快大约30%。这也给我们提供了一个为什么VMmark得分为什么这么极端的线索:大量虚拟机可能过于强调交换时间了。但即使是在负载较小的时候,也很难找到超过20个虚拟机位于DP处理器上层。
还有,在测试中,ESX Scheduler在32个vCPU上分配16个逻辑CPU。这比在32个vCPU上分配12个物理CPU容易多了。这可能在六核Opteron上带来时序安排的问题。
所以我们的测试某种程度上“更偏向于”Xeon X5570。
我们将vCPU的数量从4个减少到2个。这就意味着:
-OLAP测试的4个vCPU增加一倍
-OLTP测试的4个vCPU增加一倍
-OLTP测试的2个vCPU增加一倍
或者总共24个vCPU。因此这个测试更倾向于Istanbul处理器。记住,我们的参考数据是基于4 CPU的原始得分。所以我们将参考数据调整为基于2 CPU的原始得分。OLTP和OLAP测试的参考数据保持不变。下面的测试结果与以前你所见的数据是没有可对比性的。这只是为了让你更好地理解我们得出的结果。我们计算出两个相同虚拟机的平均结果(OLAP VM = (OLAP VM1 + OLAP VM5)/2)
结果是,Xeon Nehalem这一次只快了11%。所以记住一点很重要,当谈到MP虚拟机的时候,vCPU数量与Cell大小之间的关系是非常重要的。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者