扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
作者:赵效民 来源:ZDNet【原创】 2009年8月26日
关键字:
在本页阅读全文(共4页)
ChinaGrid的建设与云计算
您刚才说的6个中心,8个学科网格,你说有一个超算的分配问题,这8个学科网格的超算怎么平均的分配到6个中心的大型机器上,这个内部有没有一个规定?
郑纬民:现在还没有说,是不是6个中心是一样大,还是其中两个大一点,三个小一点,这个还需要进一步论证。小的中心,CG投资会减少,大的中心CG的投资会增加,上面说的一个中心投资300万是平均值。
有没有在做8个学科网格和6个中心的时候,考虑过该怎么去评价客户中心的测试包括能耗、管理、应用等等方面,现在有没有考虑做的关于评价、评测的考察。
郑纬民:评测的事情,我们做了很多,其实我们清华大学,我所在的组里头,这个名字叫高性能计算机评测中心,有这么一个中心,这个倒不是跟我们网格没有多大关系,就是专门负责评测高性能计算机的,这是科技部给我们挂的牌子,不是我自己设的,是科技部的牌子,到现在为止,我们给全国的,凡是国家投资的、单位做的比较大的机器都由我们负责做评测。我们要看这个机器真的是不是很好了,还是有问题,达到了什么水平了?我们负责测。比如说曙光5000A,联想做的百万亿次机器,都是我们负责测。因此我们是有基础的,以后六个中心买的机器,我们也测,我告诉你,我们现在这个中心到现在为止已经测了20几台大的机器了,测试结果,我们去测的时候,它已经好了,不是说它还没有好就去测,都是全好了,我们测的。没有一台机器是正好的,有些问题多一点,有些问题还不小。我们有一套测试的办法。
刚才听您说,8个学科网格里面的应用,超算是算其中之一。这六个数据中心的话,我们也知道,数据中心和真正的超算中心的配置和要求也是不太一样的。超算中心可能不太要求RAS,但是像一些日常的应用可能就比较关注RAS的标准,而且可能还会涉及到很多的数据,你们做数据中心的时候也会考虑灾备及其他的非超算的一些应用,而且超算的比例你们现在有没有一个大概的估算,比如说如果大家都在用超算的话,会不会影响到其他三个服务提供的效果,还有另外一方面,你刚才说,期刊还有工具软件,这个是由谁来提供?是这些参加网格的高校都有权提供自己的一些科研成果,或者一些开发的东西,还是统一由网格的协会统一管理这些资料。
郑纬民:这里的一些数据、软件本来是什么都没有,把它建起来,这件事情就是重点学科网格的建设目标,我们要给他一定钱的,他拿钱干什么,就要把它建起来,但是以后,陆陆续续的不是有新的进来吗,我们尽可能做成自动化。相关的高校会通过提交系统来提交,而一些没有提交的我会自动拿去的,我们会做这些软件。
至于应用模式上,你提的问题实际上我们还没有想这么细。我的印象当中,这些数据的事情,比如说里面有多少隔离,多少软件隔离啊,这个对计算机的要求还不是非常大。你想想看,文稿最多也不需要多少硬盘,需求量的要求,我估计贵还是贵在高性能机器,就是超算的机器,价钱比较贵,主要是贵在这儿。一堆服务器,就是把数据搁进去了,灾备要不要做,我们也可以考虑了,有可能简单的备份就可以了,主要是经费的事。我们最多有个备份就完了,不会说到异地去实时的灾备什么,我估计可能不会去考虑这些事,也不必考虑这些事。死了就死了,丢了就丢了,丢了再来一次嘛,这又不影响,没问题。
去年底的时候,您好像开了一个会,谈云计算,今天的CG上,我们也看了第一个演讲就是关于云计算的,我不知道CG或者您本人对云计算怎么看,它在做广泛的服务的概念,您觉得CG在这方面有没有可以借鉴的,或者说云计算对CG有没有什么影响?
郑纬民:过去我们的网格更多的强调的是把北大一台机器、清华一台机器,广州一台机器把它连在一块,连在一块来合作做一件事。比较强调高性能计算,以及计算机数据共享。现在这个云计算,它强调的是什么呢?强调服务,就是说,我有一个请求给你了,你想办法给我做完,强调服务。因此我们的CG强调设备数据的共享,强调做一件大事,大的计算,云计算则强调服务。这是第一个差别。
另外,过去比较强调把几个不同地方的机器弄到一块做这个事情,现在云计算,我的体会基本上是一个地方的机器,就这一朵云,基本上这朵云,我说,我们以后做的重点学科网格基本上是八朵云,这是一朵云,云这件事情比较专用,我们原来网格比较强调通用的。我原来12个学校的机器连在一块,做什么事情,没有说只做生物的,也可以做物理的,什么都做,通用的,现在这个云计算,它是比较专用的。比如说我随便举一个例子,Google,它老是提云计算,Google的这朵云,它只做搜索,你叫它去做天气预报,它不会做。这朵云,它是搜索云,它只做搜索。比如说,我们以后做能源的这个重点学科网格,实际上是一朵能源的云,就是说它是比较专用的,不是比较通用的。
第三个差别,过去机器12个学校连起来,12个学校的使用权是谁呢,是12个学校的校长。连到一块,这12所学校。现在我的体会,这个机器使用权基本上属于这个单位,你看Google,Google这件事情,Google这朵云是做搜索的,百度这朵云得是做搜索的。他们两朵云他们不可能连在一块,自己干自己的。因此这个差别,从技术角度来说,我觉得没什么差别,都是用并行和分布处理技术。
我想问一下,因为我们说网格的通用的计算的要求,是不是需要里面的节点的架构必须要一成不变的、统一的,比如说是X86的就都得是X86的,以后可能就不会用到RISC,或者说混合异构的系统是不是很难进入到CG的版图里?
郑纬民:不会,我们一般情况下,比如12个学校连起来,也要12个学校都有机器,连在一块,没有说一个问题,都到12个学校去做一件事,那倒希望同构的机器做起来省事一点。如果异构的没问题,这个问题得直接讲,另外的问题另外讲。没有说一定是哪一种机器。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者