科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道IBM倪敦:有效信息管理架构基础设施

IBM倪敦:有效信息管理架构基础设施

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

2008年5月15日上午,在北京JW万豪酒店地下一层多功能厅召开了“企业级存储,构建新一代企业级数据中心”——2008 IBM企业信息架构论坛。

作者:张桂林 来源:CNET中国·ZOL 2008年5月19日

关键字: 磁盘阵列 存储 信息基础架构 IBM软件集团 服务器 数据中心 IBM

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共2页)

  2008年5月15日上午,在北京JW万豪酒店地下一层多功能厅召开了“企业级存储,构建新一代企业级数据中心”——2008 IBM企业信息架构论坛,参加本次会议的嘉宾有IBM系统与科技事业部存储平台总经理 Andrew Monshaw先生,IBM大中华区副总裁及系统与科技事业部总经理姜锡岫先生,IBM系统与科技事业部大中华区产品部总经理 侯淼先生,IBM系统与科技事业部大中华区存储产品部总经理 朱国良先生,IBM全球存储专家、系统与科技事业部大中华区存储平台客户方案支持总监Guenter Lange先生,本次大会将针对未来信息存储的发展趋势、新一代企业数据中心、信息基础架构等多个层面展开讨论与交流。

  会上,IBM软件集团亚太区存储解决方案首席专家倪敦先生进行了有效信息管理架构基础设施的演讲。 

  IBM软件集团亚太区存储解决方案首席专家倪敦先生演讲

  倪敦:今天很高兴能够在这边跟大家交流一下存储架构管理的解决方案,我负责IBM亚太区存储软件支持团队。我的题目就是存储架构管理,我想分成几个个部分介绍一下IBM在这方面的解决方案。第一部分是为什么我们要设计管理解决方案;第二部分是端到端存储解决方案的细节,因为今天各级领导和专家讲了很多内容了;第三部分介绍一下解决方案的特点和优势,同时介绍国内主要的案例,在建行数据中心存储系统的存储架构解决方案的项目。

  为什么我们要讨论这个题目?前面专家讲了很多了,第一就是数据的增长量,这方面的增长速度越来越快,有一个详细的IDC的统计,在2003年一个企业作为业务系统来说,平均每个人的数据量大概是0.8个GB,这在原有的IT管理系统运维中是没有任何问题的。到了2006年这个数据量增长到24个GB,到了2010年预计平均每个人业务数据量将达到128个GB,以我们现有系统管理的资源、运维的人员很难满足增长的需要。实际上我们做存储管理主要的内容、主要的目的就是改变我们存储信息管理的方式,在现有的成本基础上满足数据不断增长的管理需求,回到现在,作为大型企业数据中心,在2000年左右,我们做的数据中心都是10几个TB,几十个TB的。这两年做的数据量一般是几百个TB。现在一些基于TB级的数据中心已经在建设了。这样大型的数据中心平均每年以30%的速度递增,作为数据中心具有高端磁盘阵列,就有几十台以上。同时,由于我们国内的采购模式,这种竞争性的采购的标准,很少有一个大的数据中心会采用单一厂家的设备,所以一般我们见到客户的数据中心基本上都是由IBM、EMC等这样的磁盘阵列组成,这样为我们存储管理带来复杂的异构型管理的问题。

  现在主要的存储设备、高端存储设备设计的都是直接通过专线网络把故障信息发到厂家这种方式,由于我们国家标准的推广,银行、电信为了保证业务安全性和金融安全性会因为规则会取消这种方式,这样使我们存储管理面临更大的困难。面临这样的情况,我们怎么解决现在的存储管理的问题。

  现在存储管理已经由以前单一的通过简单工具、通过配置供给察看状况,已经变成了整体的存储管理的系统问题,我们存储管理实际上已经不能把它放在一个单一的存储管理系统,必须把它放到整个IT系统管理的过程中,基于ITIL来说,整个系统网管和系统管理是一样的,标准存储,存储的性能管理是必不可少的,第三存储的事件管理以及报警,第四存储的历史数据分析以及报告,比如存储的配置管理,这几部分管理每个部分都是很复杂的部分,现在IBM有一个比较完整的解决方案,就是IBM的ISM解决方案,这个解决方案把我们所有系统的管理方案基于ITIL设计在一起,完整的端到端的系统解决方案的指导,在这个过程中,实际上把整个系统管理根据客户需求分成七大部分,其中主要的部分就包括系统的Security,包括IT Storage Enterprise,包括Serivce provider等等 ,这样其中存储作为很重要的一部分,主要分成四块,第一是数据安全性的管理,第二是如何各种国标、各种规范,数据管理、存储中心的设计必须使数据符合规范,这些数据的运维和管理也必须能够依据规范来运行。第三部分就是现在数据永久保存已经成为整个的新的数据存储话题,下面可能根据行业标准提出新的数据规范,我们如何根据数据生命管理周期满足对于业务的管理需求,这是我们管理所做的一部分工作。

  还有一部分是数据的avaliability管理,主要四个问题。IBM基于存储软件方面现在主要有三个解决方案,第一部分就是Data protection解决方案,第二部分就是存储资源和架构管理解决方案,第三部分要做的是RAM、数据生命周期解决方案,基于三种解决方案,刚才专家都讲了,主要有一系列的产品满足它,构成相关的Solution结合在一起。

  倪敦: 第一个主要就是以前的解决方案,今年4月份为了满足数据管理的需求,收购了FilesX这是新的数据备份解决方案的系列产品,并不是单一的工具。FilesX是以前的数据保护都是基于时间点进行备份,比如每天晚上进行数据备份,备份窗口下多长时间可以完成,这就会遇到DR方面讲的问题,就是普通软件级的数据备份,只能满足前三级容灾的要求,当我们发生故障的时候,因为是昨天晚上备份,数据丢失时间RTO是一天以上,因为要做一个长时间的restore到一天的时间。这样的话,把数据存储的时间由一天缩短到一个小时,甚至更短。所以FilesX就是一个非常主要的数据保护解决方案。

  有几大特点,第一是Disc到Disc的备份,符合很多用户要求。FilesX并不是基于应用和操作系统来看的,是基于数据传输底层数据I/O判断的,发生变化的时候,自动就会把I/O传输到备份服务器上,所以能够做到数据块发生变化就自动保存下去。FilesX还有一个特点就是当我的数据发生灾难的时候,恢复的时候,恢复操作刚一开始,卷一开始的时候所有的数据都可以进行访问,就像普通的恢复好的磁盘阵列一样都可以使用。因为FilesX有一个技术当你访问这部分磁盘的话,这部分数据没有完全恢复过去的时候,FilesX会自动把I/O自动转移到一个中心上,从中心上直接把I/O发出去,通过FILESX的技术,业务系统就是可用的。数据备份的发展方向,这是我们IBM data protection的方案。

  第二部分就是数据今天主要的存储架构解决方案,我们现在主要看的就是第一个解决存储架构解决方案的异构性,能够满足中国数据中心满足不同企业、不同厂家的磁盘阵列进行统一管理。第二能够做一个存储架构的管理平台,能够实现存储管理的拓扑、事件、故障以及报告这部分的管理。同时能够根据客户的需求定制管理的解决方案,定制出根据客户的业务需求实现的业务方式,并不是装上去之后我只提供几种功能,如果客户需求超出这种功能就不能够实现,不是这样的过程。

  第三部分就是生命周期管理,包括ROM、DR550这一系列解决方案。

  我今天重点介绍一下第二部分存储架构解决方案,从这里面我们看到,解决方案主要是从基于ISM,主要从三个层次来看,第一个是解决方案的可视化,第二个是解决方案的可控化、第三个是解决方案的自动化。所谓可视化能够把系统之间的相互之间的关联关系清晰检测出来,检测出状态。可控化就是能够把现在所有存储的设备和架构很好地组合在一起,能够满足业务系统运维的运行需求,这部分一方面包括物理的,磁盘阵列、交换机等等,另一方面包括虚拟的,存储的管理流程,以及服务。自动化是指我们现在建设的存储系统、存储中心必须是一个灵活的、可变化的系统,这是指存储系统构建敏捷性的存储系统。当业务系统上新的业务系统、提出新的业务管理的需求时,现有的存储中心、存储系统能够很方便地自动调整它的方向,支撑新的业务系统的变化,这就是自动化的问题。

  下面我详细讲一下我们存储管理的解决方案。作为IBM存储架构管理解决方案核心就是IBM TotalStorage Productive Center (TPC),这个解决方案是一系列的产品构成的,作为现在的TPC有两大部分,一部分是TPC Stantard,这是一个标准的存储架构管理的平台,能够实现存储的资源管理、故障监控、性能管理、事件管理。第二部分是TPC专门做大型数据中心、做DR数据复制和远程的管理,作为存储架构管理,这点比较清晰。

  倪敦:这是我们做的一个项目的例子,在这个例子中,我们可以看到,作为一个完整的存储架构管理,首先包括存储资产管理,概述方面:

  第一部分存储资产管理,包括磁盘阵列、交换机、镜像磁盘阵列的状态,同时报警出现在主要设备发生的主要的重要事件、主要违反的事件有哪些,

  第二部分是存储资产和容量的评估,首先要评估出现有的资产能否支撑现有的系统运行的需要,比如两、三个月以后现有的系统还够不够。哪些业务系统存储增长量最大,哪些系统由于业务失误有大量的空间没有使用,这样可以很好地调整我们的业务系统。在2.2我们可以看到,必须做出存储趋势分析,支撑存储运维的需要。

  第三部分是存储变更管理,作为IT管理变更管理是很关键的一块,如果不能很好地做变更管理,经常发生一些不可控关键性的故障,现在整个IT运维发生的故障70%,都是在变更过程中发生的人为操作。所以我们必须考虑存储的变更管理。

  第四部分就是性能分析,很关键,当存储系统建设之后,我必须怎么样评估它日常运维的状态,哪些可能是一些瓶颈,哪些运行的状态很好,基于存储系统要做性能分析、负载分析。后端还包括我们做的DR,不仅包括生产中心的存储系统监控,同时还包括容灾中心这些镜像存储系统的监控,如果不能很好地监控镜像存储系统,可能灾难发生的时候,我们会发现镜像数据错误的,比如I/O的峰值造成问题,当灾难发生的时候会造成整个数据的不可用。

  下面我们分几个部分来看一下TPC如何实现存储管理的解决方案:第一部分,我们的存储拓扑管理必须能够形成分层、深入的拓扑的分层。在这个过程中,我们必须能够生成从服务器、交换机、磁盘阵列再深入到每一个磁盘阵列的卷,这样一个磁盘的拓扑。在这里我们看到,这是我们的基于交换机的拓扑的关系。第二部分是我们从交换机端口到服务器的连接关系。第三部分看到分层次Inside到磁盘阵列内部的分层次的内部磁盘阵列划分的连接状态。

  第二部分在整个的存储拓扑管理中,不仅能够生成这种拓扑,同时要生成关联关系,不能单独看到这个层次,要看到层次之间的连接以及可能带来的问题。在这里面我们要构建端到端的拓扑的连接状态,在这里我们可以看到,从我们服务器数据通道通过哪个HPA卡连接到哪个交换机的端口,同时连接到磁盘阵列控制器的端口,以及连接到哪一个磁盘卷组,在这样的过程中,随时点击查询到每一个状态信息,分析磁盘阵列数据访问通道中所运行的状态。(见图),这是我们通过TPC能够实现的,比如我们选中一个服务器,在这里可以直接看到逻辑卷是哪些,卡是哪些,交换机,磁盘的记忆卡是哪些,这样可以由针对性的从复杂的数据中心,比如十几个高端阵列有几百台服务器,选择哪个服务器可以把它单独连接状态列出来,查询和监控它的状态,同时看到实时的性能状态,这样很容易就分析出数据传输通道中性能的瓶颈,还有故障高发期在哪个阶段,可以提前预测发现可能在哪个阶段发生问题。当问题没有发生之前,我提前就会把一些设备更换或者重新划分一些区,重新做一些卡,重新划分出一些存储空间,这样提前解决可能会发生的存储故障。

  底下还有类似事件窗口的东西,可以把所有数据传输通道都显示出来。在这里面我们可以看到,为什么TPC能够实现异构的存储管理?其核心就是基于现在开放的XMi-S的标准,TPC是完全按照XMi-S标准设计的平台,2003年的时候管理的系统很少,2008年所有主流厂商都支持SMIS新的设备。这样基于TPC可以很容易地进行数据中心的管理,我们可以看到在这个架构中右边是我们所要管理的设备,现在主流设备无论是磁盘阵列、存储交换机都是基于SMIS管理存储的,像基于SMP管理的存储方式很难更加深入全面管理存储系统了。在SMIS有四个点,这四个点从磁盘阵列、设备进行关联,同时根据CIMOM查询信息,通过CIMOM和XMi-S来传输。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章