扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNetChina服务器站 11月28日虚拟化技术讯 IBM在北京隆重举行了以“虚拟科技,绿色中国”为主题, 为期两天的2007 IBM虚拟科技大会。以下为 IBM 系统存储高级专家顾问Peter Crowhusrt演讲实录。
Peter Crowhusrt:各位早上好!首先,我想来讲一讲存储的虚拟化。也许你们也听到了很多的关于服务器的虚拟化,所以下面我专注于讲一下关于存储分析,我也希望给大家展示一下存储的虚拟化和绿色数据中心是相互之间共同来运行的内容。
对于IBM来说,虚拟化也并不是一个什么新的事物,实际上IBM从概念来说,它的理论以及它实际的做法,在虚拟化方面,就是从60年代开始的。所以,最初的虚拟化的发起,是我们来提出的,IBM最初是想要一种共享的工作负载,在主机上开始的,一直到这样一些叫做虚拟内存的概念开始。实际上Z/VM有一个35年的周年,这并不是新的概念。从这个地方我们开发出了一些新的技术,进入到这样一些服务器的领域,所以我们有硬件、中间件等的整合,我们还有我共享的工作负载的大型主机上。现在这样一些概念,又在进一步的发展,今天我们所有人都知道LPAR或者是逻辑分区的概念。还有,虚拟化的存储来说,在IBM也并不是什么新的东西,我们叫做VTS,差不多是90年代发布的虚拟的存储的服务器。然后,我们第一个在企业级的存储服务器上有虚拟的磁盘,是在99年发布的。这样的SAN卷控制器你们已经听到了,它的发布是在2003年,实际上我第一个客户的安装当时是在2003年底,是1.2版本的,所以这些机器已经使用一段时间了,实际上SAN的卷控制器,已经到了4.1的版本,差不多已经是第九代发布的版本了,是非常成熟的产品,在过去的4年里面的发展也是非常快的。
我们今天有一些综合性的范围的虚拟化提供商,在服务器的领域上我们从x86一直到大型主机,我们整合了这些工作负载,整合到非常少的物理的工作负载上。还有软件像VMWare等等,我们可以提供这样一些功能,就是可以更多地进行服务器的虚拟化的概念。这些概念在存储领域也是非常类似的,也是可以很容易理解的。
在存储的产品里面,我们有下面分层的虚拟化,还有整个的系统,还有实际的这样一些数据块的虚拟化的存储。在这个领域里面,我们有一个产品叫做通用的、并行的存储的GPFS,它是什么呢?给我们提供共享存储的文件管理,是在这个共同的域名里面,不管这个文件在什么地方,所有的目录都可以看到这个点的结构,而且可以共享这个文档。
GPFS是1968年发布的,我们已经有60个许可证在全球发布。也许你们会注意,在这些负载上,有一个产品叫做存储池。它是一个虚拟的文件系统,其中有很多的功能提出来了,放到了GPFS。它有这样一些完全的法律的遵从性,有这样的一些其他的提醒。在这些产品的系列里面,我们可以提供一些系统的虚拟化。有多个不同的文档系统,可以放在一个域名的文件里面。它的使用是非常透明的,像Windows的驱动器和其他的系统,都在这些系统的地方,对于这些中端用户是透明的。这些策略、存储是在这个功能上。我们再往下看还有卷控制器,或者叫做SVC,它也提供一些虚拟化的存储,有这样一些存储池,可以进行数据在各个存储池之间进行迁移。整个的服务器在迁移发生的时候,是不间断的,它可以控制非间断性的迁移。可以从分层的存储迁移到我们需要的地方,对于主机的支持是不间断性的。
为什么实现存储的虚拟化呢?是因为我们今天有很多的数据要进行存储,数据的增长如此之快。所以,用传统的方法存储数据、支持数据,对于存储来说,是非常复杂的一些流程,来做这样一些数据的恢复。还有非常复杂的迁移的流程,随着我们技术的发展出现。我们要从一个机器向另外一个机器迁移是非常复杂的,所有的事情都是非常耗时的。而且,是非常复杂的。所以,今天我们来使用虚拟化的技术,来克服很多的问题。一些老的方法不能满足需求了,只能用新的方法来进行这样的工作。
利用率来说,今天早上我们已经提到了,传统来说,我们有一些信息像孤岛一样,一个服务器有很多的存储是从来不被利用的。另外一些服务器可能存储用得并不是很多,并不是大量地使用。
那么我们使用的卷的控制器怎么做呢?SVC怎么让我们做呢?在整个的池内调用这样的存储,可以利用现有的存储的基础设施,可以使效率更高。而且,可以让我们存储的管理员,能够分配这些存储,可以加入一些服务。因为我们有这样的存储池,有存储的管理员可以进行重新地分配,能够在虚拟的磁盘上添加。比如说动态的进一步的扩展。我们多数的客户,他们有这样的一些存储的卷控制,提高他50%管理员的工作效率,他过可以管理比以前两倍多的存储,这是跟传统的存储管理相比的。
更多地来讲,SVC本身是磁盘存储的虚拟化,很显然它可以有这样一个物理磁盘资源概要的示图,可以看到这样的托管的服务器。我们有这样的逻辑的卷,在整个的存储上。这个LAN可以变成一个通用的磁盘的设备,在所有的平台上不管是Linux还是UNIX,还有Windows和VMWare都可以。所有的托管的服务,都有同样的LAN,使用同样的驱动器,来使用多路径进入的驱动器,能够有这样的磁盘。这个虚拟化是在一层,然后把虚拟的磁盘映射到后台的物理资源上。可能这个主机并不知道是哪个厂商的后台的物理磁盘。因为,有这样的一个虚拟化的层,可以进行映射,从虚拟到物理的。存储的管理员并不一定要有这样的技能,在后台的物理资源上可能有不同厂商的设备。只要通过一个智能集,虚拟化一层就可以了。所以,你的流程、程序、灾备的程序进行迁移,就变成了一种通用的。不管他这些平台的厂商是谁,或者是一些设备的物理厂商是谁,都可以使用。
所以,生产率、管理性都得到了进一步的改进。另外可以做什么呢?另外,他们在设计一些逻辑的设备的时候,我们可以做高级的功能,我们可以做拷贝,我们可以做远端的镜像,在远端的卷之间。
它可以做什么呢?它可以使我们不受物理的厂商的互动的限制。即使在我们IBM的产品范围内,我们的DS4000和DS8000系列,就是从远端的复制也不能沟通,在物理的设备上来说。IBM和EMC的设备是不能沟通的。如果我们进入到逻辑这一层,我们可以做这一点,拷贝可以在各个物理的厂商、设备之间,我们可以做一些远程的复制。就是说,从一个物理的设备类型,到另外一个厂商之间,或者是另外一个类型进行复制,所有的虚拟化这一层,使得我们有一个开放的,独立于任何厂商之外的管理的存储。
下面更多具体地讲一下关于SAN的卷控制器的结构。这个SAN卷控制器的结构,我们来创建一些这样虚拟的磁盘。它是附加在这种主机上,它只看到了一些物理的磁盘。同样的卷控制器,它拥有所有的一些后台的物理的设备。它并不只是能够看到,或者是连接物理的设备,它只看到了逻辑的呈现。同样的卷控制器,它是由带内的虚拟化的解决方案,它可以基于一些节点对上,最多你可以移到4个节点对,这样形成一个集群,他有一个叫做横向的整合方案,这些节点都是基于IBM X3550的服务器。它有两个双核的处理器,SPC的代码叫做多内核的,能够有这样一些双核的结构。
我托管这样一个虚拟的磁盘的话,虚拟的磁盘它有一个自己所要使用的节点对的节点。它能够写入到这个节点里面,再镜像到合伙的节点上,我们有合适的结构。
物理的存储,在后台来说,分成我们叫做管理的磁盘组,这个磁盘组可以是一个物理的设备,或者是一个子系统,是物理系统的一部分。
这样的一些能力,对于同样一个卷控制器来说,能够不间断地进行数据的迁移,是由这样的磁盘组来进行的。我们可以把数据从一个管理的磁盘组迁移到另外一个磁盘组,或者是将托管服务中心进行迁移。再往下,你虚拟层的存储管理员,他迁移这些设备,在虚拟的物理资源之间,可能是来自不同厂商的设备,或者是在虚拟的磁盘池之间,可能是1层到2层进行迁移。
然后SVC是一个叫做绿色的进行存储的。这样讲什么意思呢?因为我们有安全的存储,你可以使用不同的功耗的成本。就涉及到不同的管理的磁盘组,比如说磁盘更高一些。你可以把数据在不同的存储之间迁移,所以比较低的IPM都可以。
这可以帮助我们提高我们能耗的效率。这是比较低速的磁盘的话,或者是大容量磁盘的话。在同样的IBM上面,意味着功耗成本在存储里面更高一些。然而,我们又涉及到一些性能的要求,对于这些数据来说,同样的一些卷控制器,还有一个虚拟的磁盘,驱动这个磁盘是要在整个的阵列里面,在管理的磁盘组里面。如果我们有20个物理阵列的话,比如说每个里面有8个磁盘,一个虚拟磁盘要驱动整体的阵列,在虚拟的磁盘上,在这个池上,在磁盘阵列里面。这里面有很多的客户,他们可能有上千的客户,在我们的案例研究上。比如说我们有内部的咨询,跟我们的客户讲,我们在采用这样的SVC的时候,在性能方面有很大的提升。
我们这里面做什么呢?我们跟他讲,不光是收益上,我们同样地有性能,可能是性能更好一些,但是来使用比较大的容量的驱动器,或者是比较缓慢的驱动器,我们使用的能耗更低一点。但是,它涉及到性能上的影响。这样一层的数,我们可以得到这样一些性能。另外一个功能是ILM,它涉及到信息周期的管理,它也可以得到改进,通过SVC。就是要把数据通过这样一些层次进行移植,你可以做这个ILM,可以从软件,比如说我们的HM、TSM还有很多的产品可以做到这一点。或者是,你可以用更多的办法去做,可以把人工进行迁移,通过SVC,通过我们虚拟这一层加一个控制。
还有,我们讲到了利用率的问题,能够在这个磁盘上提高利用率。把并不太多的汇总在一起,另外改进虚拟化,改进虚拟的配置,叫做瘦配置的供给。这里面提供一个虚拟的磁盘。这样是虚拟的磁盘的技术,可以说是逐渐的P的拷贝。还有,能够来提高效率。我们有数据的压缩,还有其他一些机制来做到这一点。
我们的N系列的产品,做瘦供给的策略是非常好的。另外,可扩展性、可用性也是基于我们Intel的硬件,本身就是非常高可靠性的,在全球高可用性的领域应用很长的时间了。
在硬件上来来说,我们的软件和功能都是由SVC来提供的。它的设计也是作为企业级的存储服务器,所有的地方我们都可以看到,我企业的服务器上,你也可以在SVC上看到。比如说我们有这样的一些镜像的缓存,有镜像的功能,你可以添加节点,可以非间断性的增加到我们的集群上,有横向的增长。我们可以做并发的工作负载的共享,我们还做这样一些并发的代码的加载,我们叫做快速节点的做法。SVC的节点可以触发这样一个主机,目前做这样一些代码,也是差不多是15到20秒可以做到。我们这里并没有说一些详细的,包括一些纠错或者是其他的部分的恢复,就不说了。
并不只是这方面,SVC还有这里面提到过,它是一种性能最快的存储的子系统。存储的性能的协会,它有这样的一些基准,是SPC1的基准值,还有工作负载。SPC2是更加的工作负载。一个是来自于测量,它按每秒的性能,还有对于吞吐量的测试。SVC是横向的可扩展的解决方案。目前,也是速率最高的。刚刚发布了4.2的版本,里面强调了很多的性能的要求,我们以后还有很多的变更。对于最基本的锁定还有很多的性能要求。
因此,我们期待的数字,可能会有很大的增加,在今后新产品的发布中,会有很大的提升。当然,SVC有很多的客户的不但地扩展,原来是一个TB,可能会到PT。这个是SAN控制器现在的情况。这是一个非常开放的,而且完全独立于供应商之外的,因此不可能供应商把它控制起来、封锁起来。我们有SVC的不一定非是IBM的储存,可能EMC不愿意我说这样的话,但是大家可以看到,在任何的环境下都可以用SVC。那么客户不同磁盘和磁带的支持,因此我们有120个各种不同的磁盘的存储的在后端支持。
另外一个功能是SVC可以带来什么样的功能呢?就是更好地利用你的存储架构。如果SVC有一些功能,你现有的存储可能没有远程镜像、拷贝等等,因为现在的存储比较老了,它不支持这样的功能。
或者是因为你还没有付专利费,不可能现有的功能能够囊括。但是,有了SVC,你把它放在上面,重新使用现有的磁盘,而且对于投资回报获得更好的收益。因为同样的卷控制器,它就有更好的功能了。
这是一些客户,我随机找了一个。在澳大利亚的新西兰,有10个SVC的客户是我经常去拜访的,不光是技术销售要跟客户见面,实际上每次给他们介绍的时候,我都是非常有激情帮助他们做的。我每次都想自己亲手动手,这是一个客户他们使用SVC放在自己的公司,他们以创新的方式使用它,比我想得还有创新性。他们不断地降低自己的当前的存储成本,后端不断地使用。
大家可能知道,一旦机架上放满了以后,你还要再买新的机架,还要把新的机架上放满不同的机器。这个客户实际上在两个机架上来回替换,我们不是买很多新的东西,我们在磁盘上不断地增加和调整,很快地在两个不同的机箱中来回地调整数据,节省很多的资金。他们使用Tivoli的产品比较多。SSPC就是磁盘、数据还有光纤,另外还有很多的性能的提升,这是我们澳大利亚的保险集团。另外还有一个银行的客户,他们有很多的Windows、SAN等等的应用,同时有很多的理念,他们可以搞互联网的银行的服务。
磁盘就不说了,我们还有虚拟的磁带。虚拟磁带驱动器有很多的物理磁带驱动器。因此,我们可以提供的是非常好的,少提供磁盘驱动器,是一些虚拟的磁盘驱动器。这样,我们可以把它有一些专用的,也可以是共享的,也可以把它分区。
我们像磁盘虚拟化一样,磁带虚拟化实际上也是一样的做法。这样,使我们的客户能获得更好的性能的提升。这样,我们很多的客户使用寿命也比较长。另外,你不用找很多的磁带,要不然磁带库大了以后,你还得从里找。
另外,帮助我们省物理设备的卷堆,我们还有好多的非常好的,我们现在应用一般是从一个文件到了一个磁盘,过去我们发现很多的磁带比较多,也不好找。现在,我们就可以节省这样的供需,有了虚拟化的变化,我们现在就比较少。
这个是一个例子,就是我们虚拟磁带,客户在使用虚拟磁带以后,他的总拥有成本。这样,通过这样分析,你就可以知道他们省了多少。我们可以非常详细的把分析做得非常细,这样我们就可以看看这个客户有80个磁带驱动器,而且分布在不同的地方,我们分析它的增长情况、使用量,目前的磁盘到底有多少。
那么客户希望能够在今后的4年中有一个计划,我们现在有一个TS,有60个目前新一代的磁盘,原来是86个,变成了60个,我们给客户节省了20多个驱动器。但是,性能也提升了。经过了4年之后,肯定会有提升的。我们比较一下,在它的耗电、节能的情况,你可以看到,节省了很多。如果用火电一算的话,可以大量减少二氧化碳的排放量。因为你节省了很多的磁盘驱动器,省了很多的电。
下面我们给大家介绍一下虚拟化和绿色存储。我给大家提一个建议,你再看一下您自己的使用情况,您看一下你们分层的存储战略怎么样,你看看能不能把更多的数据移到下面的ATA的磁盘中去。或者是,大量地来调整,不要忘记SVC。SVC的缓存,它可以给你降低很多的空间的使用率,让你的质量翻一番。而且,现有的磁盘,还有很多的驱动问题。实际上,你们完全可以实现这样,可以帮助我们节省很多的空间。比如说ILM,你们可以把更多的数挪到磁盘当中去。可以节省很多的功耗,另外很多的功耗是非常优越的新的技术要采用。
现在IBM很多新的产品都是能耗非常好的,比前一代的产品节能更加好,我们可以做更多的工作,而且使用的电力也更加少。另外,更加有效地使用我们的存储空间。
我们刚才讲到了卷控制器、SVC都是适应现有的存储。那么它可能是60%的使用效率可以提升到90%。另外后端的存储也是非常好的,为什么使用RAID6?因为有的时候20TB才能使它提供这样的数据,为什么这样做呢?因为RAID5比较合适,可能你要提升性能。但是希望大家重新看一看,你后端是不是需要RAID5,能不能提供你所需要的虚拟磁盘和磁带的能力。
在存储虚拟化未来的情况怎么样呢?传统来讲,现在很多的存储子系统有很多新的功能,把它体现在虚拟化的过程当中。传统来讲,我们是在物理存储设备中给大家介绍。但是现在看,现在很多的功能已经挪到了虚拟化这一层来,列入了虚拟磁带和SVC上。一开始SVC刚推出来的时候,它只是想干什么,现在有很多新的功能,在DSS之前还有很多的SVC上都有已经完整地产品。现在有了4.2,Cache就下来了。它可以带来更强大的功能,随着我们虚拟化的功能也与之俱来。加强了我们产品的速度,也加强了互操作性。另外,我们要不断地推出新产品,这样同时可以增加我们的可扩展性,不断有新技术、新的CPU、新的缓存,还有SAN光纤通道的速度越来越多。例如8个GB的支持,存储目标容量等等有很多推出大的虚拟的磁盘。
现在的技术我们有8个TB可以支持,可能还会增加。我们现在有4000虚拟的磁盘,它还会增加。目前的容量只是2TB的容量,同时可以做多少,现在数字在不断地增加。随着我们推出新的SVC的代码,就可以看到更多的新的功能支持我们的数字不断地上升。另外,中短期我们是放在加强业务连续性的功能。比如说数据复制等等,实际上可以有16个源数据的复制,还有一些快速的瞬间复制。另外还有数据的复制就是安全,有一个远程的镜像。当然,性能也是一个方面,碎片整理、动态性的优化,以及在今后几年还有新的技术出现,还有数字重复,删除和数据加密,也会把它放在我们的虚拟层的层面上。
因此,我想再总结一下,对于IBM来讲,虚拟化并非一个新的事情,实际上我们有40多年的搞虚拟化的历史了,因此,我们在硬件和软件方面都是有基础的。SVC还有虚拟化实际上是绿色存储技术的加速器。是通过动态数据的转移,还有非中断性的移动,可以给我们提供更多的绿色数据中心。另外,SAN的卷控制器,是目前两个非常好的产品。它现在来讲是非常有竞争性的,从SAN的卷控制器,EMC号称自己有200多个客户,日立好像说他们有占10%的市场份额。
IBM大家可以从早些时候看这个图讲,我们已经交付了1万个SVC的节点。其中有3400多个客户,这都是4年中我们的客户发展壮大的结果,因此我们对此非常有信心。为什么非常成功呢?因为它是开放的,而且是独立于供应商的,同时给你一个总的拥有成本比较低,效率比较高。
那么未来的前景怎么样呢?我想说今后的技术中,将会在存储的虚拟化层面中,将会有越来越多的功能。他可能会大大产生大跃进的发展,带来更多的功能。
我们的物理存储转到虚拟存储发展,给大家介绍,给客户带来了很多经过实证验证的优点。我们进入到虚拟存储的世界中,你必须要问一个问题,为什么不搞这个呀?因为确实有很多的理由,你应该这样做,但是你进入到做决策的阶段,我们要做的问题就是,我们是不是能够让IBM给我们提供这样的解决方案,帮助你分析一下你能够实现什么样的好处。同时,你要记住,存储虚拟化还有绿色数据中心的发展,是共同发展的。谢谢诸位,我的发言结束!
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者