扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
2006年8月25日
关键字:
在本页阅读全文(共5页)
冗余设计保证系统可靠性
在IT领域有个专业名词叫做“单点故障”(Single-point Failure),这好比计算机的电源线插在电源插板上,由于只有一根电源线,如果断了那么系统将立刻断电。服务器设计中也有类似的情形,我们不能容忍服务器掉电或者在电源、板卡接口上出现故障,因为服务器是用作核心应用的——个人用户可以重启PC,但是企业用户则希望重启服务器的举动越少越好。“冗余”这个字眼从日常生活里的“多余”演变而来的,在这里则变成了非常重要的稳定性保障。没有冗余设计就意味着在整个系统中埋伏着许多潜在的“定时炸弹”,这些隐藏的“单点故障”嫌疑将使得企业的IT系统构建在不够坚实的地基之上。
降温散热需整体设计
随着服务器集成密度的提高,整个刀片中心的散热要求随之提高。强大的计算能力需要多CPU协同工作,而CPU本身以及相关设备都需要刀片机柜具备强大的散热降温能力。部分厂商在进行刀片服务器设计改良时,只会做一些非常简单的改变,例如简单地把服务器压扁,仍然为每个服务器配备类似“壁挂式空调”来帮助每个刀片单独散热,这样可能会带来两个问题:我们需要每天去检查每个风扇是否正常,出现问题时需要对每个散热设备进行更换。最关键的是,这种做法只能保证刀片服务器自身的散热,而忽视了机柜空间内的空气流通和整体散热。
IBM采用类似“中央空调式”的整体散热技术,来帮助整个刀片中心进行降温。IBM刀片中心的散热系统设计,是用两个冗余的风扇对放置在刀片中心中的14片刀片进行散热,就像酒店的中央空调系统能够对各个房间同时进行散热。而且刀片中心的散热系统采用双冗余的设计,如同配备了两套“中央空调”。HP BladeSystem C-Class则通过新的能量智控(Thermal Logic technology)技术专门解决电源和冷却系统问题,并配备用于监控刀片发热量和机架内流动空气温度等情况的监视工具,能够向管理控制台报告机箱内的温度,使系统管理员能够跟踪每台刀片服务器或机箱的耗电量与冷却需求;智能化管理工具可根据电力需求量在多个电源装置中自动停止和重新启动部分装置。
硬件厂商设备的整合能力
在整个刀片中心的系统架构中,用户需要厂商提供IT系统解决方案。我们可以通过一个典型的例子了解刀片架构的强大整合能力,假设要建设一个中型企业计算数据中心,一般需要许多设备来帮助支撑中小企业的计算以及网络和存储平台,配置如下:2路CPU的服务器10台、基于RISC的2路CPU的服务器1台、4路服务器1台、7层以太网交换机1个、光纤通道存储交换机1个加上许多光缆、2层以太网交换机1个、KVM切换机至少1个、网线若干、KVM电缆若干、电源线若干。而当IBM、HP、Dell等厂商把这些技术集成到刀片服务器当中后,一个刀片机柜就可以整合原先的所有设备,简化了用户搭建数据中心的成本,无论是空间成本、管理成本还是使用成本都将大大降低。
先进的软件方案整合能力
除了硬件整合能力外,是否具备成熟先进的软件方案整合能力,也是用户在选购刀片服务器时必须关注的一点。 IBM在拥有软件产品解决方案的同时,与很多著名的软件方案提供商都有在刀片服务器上的合作,如VMware、 CITRIX、Novell、SAP等。同样,惠普和戴尔在刀片服务器上也与多家著名软件厂商保持着合作关系。对于企业关键应用,IBM的刀片服务器可以实现基于VMware在刀片间不间断任务转移。此外,当BladeCenter上面开了很多虚拟的VMware Server,需要对一台刀片服务器的内存、CPU或者硬件设计进行扩展或调整的时候,它上面的应用可以不停机地切换到另外一台拥有VMware V/Motion的刀片上面,所有的数据包括内存上的数据都会不间断地迁移过去并予以保存,待原有刀片的维护工作完成后再平滑地迁移回来,以保障计算任务能够不间断的运行。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者