科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道ChinaGrid专家郑纬民:ChinaGrid第二期更令人期待

ChinaGrid专家郑纬民:ChinaGrid第二期更令人期待

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

近日,China Grid 2009研讨会在山东烟台举行,会议的重要议题就是有关ChinaGrid(下文简称CG)的二期建设,而在会议期间,我们也有幸采访了CG专家组副组长、清华大学教授郑纬民先生,以及长期密切关注并积极参与CG建设的英特尔(中国)有限公司大学合作经理郭朝峰先生,了解到了有关CG二期的规划和愿景

作者:赵效民 来源:ZDNet【原创】 2009年8月26日

关键字:

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共4页)

ChinaGrid的建设与云计算

您刚才说的6个中心,8个学科网格,你说有一个超算的分配问题,这8个学科网格的超算怎么平均的分配到6个中心的大型机器上,这个内部有没有一个规定?

郑纬民:现在还没有说,是不是6个中心是一样大,还是其中两个大一点,三个小一点,这个还需要进一步论证。小的中心,CG投资会减少,大的中心CG的投资会增加,上面说的一个中心投资300万是平均值。

有没有在做8个学科网格和6个中心的时候,考虑过该怎么去评价客户中心的测试包括能耗、管理、应用等等方面,现在有没有考虑做的关于评价、评测的考察。

郑纬民:评测的事情,我们做了很多,其实我们清华大学,我所在的组里头,这个名字叫高性能计算机评测中心,有这么一个中心,这个倒不是跟我们网格没有多大关系,就是专门负责评测高性能计算机的,这是科技部给我们挂的牌子,不是我自己设的,是科技部的牌子,到现在为止,我们给全国的,凡是国家投资的、单位做的比较大的机器都由我们负责做评测。我们要看这个机器真的是不是很好了,还是有问题,达到了什么水平了?我们负责测。比如说曙光5000A,联想做的百万亿次机器,都是我们负责测。因此我们是有基础的,以后六个中心买的机器,我们也测,我告诉你,我们现在这个中心到现在为止已经测了20几台大的机器了,测试结果,我们去测的时候,它已经好了,不是说它还没有好就去测,都是全好了,我们测的。没有一台机器是正好的,有些问题多一点,有些问题还不小。我们有一套测试的办法。

刚才听您说,8个学科网格里面的应用,超算是算其中之一。这六个数据中心的话,我们也知道,数据中心和真正的超算中心的配置和要求也是不太一样的。超算中心可能不太要求RAS,但是像一些日常的应用可能就比较关注RAS的标准,而且可能还会涉及到很多的数据,你们做数据中心的时候也会考虑灾备及其他的非超算的一些应用,而且超算的比例你们现在有没有一个大概的估算,比如说如果大家都在用超算的话,会不会影响到其他三个服务提供的效果,还有另外一方面,你刚才说,期刊还有工具软件,这个是由谁来提供?是这些参加网格的高校都有权提供自己的一些科研成果,或者一些开发的东西,还是统一由网格的协会统一管理这些资料。

郑纬民:这里的一些数据、软件本来是什么都没有,把它建起来,这件事情就是重点学科网格的建设目标,我们要给他一定钱的,他拿钱干什么,就要把它建起来,但是以后,陆陆续续的不是有新的进来吗,我们尽可能做成自动化。相关的高校会通过提交系统来提交,而一些没有提交的我会自动拿去的,我们会做这些软件。

至于应用模式上,你提的问题实际上我们还没有想这么细。我的印象当中,这些数据的事情,比如说里面有多少隔离,多少软件隔离啊,这个对计算机的要求还不是非常大。你想想看,文稿最多也不需要多少硬盘,需求量的要求,我估计贵还是贵在高性能机器,就是超算的机器,价钱比较贵,主要是贵在这儿。一堆服务器,就是把数据搁进去了,灾备要不要做,我们也可以考虑了,有可能简单的备份就可以了,主要是经费的事。我们最多有个备份就完了,不会说到异地去实时的灾备什么,我估计可能不会去考虑这些事,也不必考虑这些事。死了就死了,丢了就丢了,丢了再来一次嘛,这又不影响,没问题。

去年底的时候,您好像开了一个会,谈云计算,今天的CG上,我们也看了第一个演讲就是关于云计算的,我不知道CG或者您本人对云计算怎么看,它在做广泛的服务的概念,您觉得CG在这方面有没有可以借鉴的,或者说云计算对CG有没有什么影响?

郑纬民:过去我们的网格更多的强调的是把北大一台机器、清华一台机器,广州一台机器把它连在一块,连在一块来合作做一件事。比较强调高性能计算,以及计算机数据共享。现在这个云计算,它强调的是什么呢?强调服务,就是说,我有一个请求给你了,你想办法给我做完,强调服务。因此我们的CG强调设备数据的共享,强调做一件大事,大的计算,云计算则强调服务。这是第一个差别。

另外,过去比较强调把几个不同地方的机器弄到一块做这个事情,现在云计算,我的体会基本上是一个地方的机器,就这一朵云,基本上这朵云,我说,我们以后做的重点学科网格基本上是八朵云,这是一朵云,云这件事情比较专用,我们原来网格比较强调通用的。我原来12个学校的机器连在一块,做什么事情,没有说只做生物的,也可以做物理的,什么都做,通用的,现在这个云计算,它是比较专用的。比如说我随便举一个例子,Google,它老是提云计算,Google的这朵云,它只做搜索,你叫它去做天气预报,它不会做。这朵云,它是搜索云,它只做搜索。比如说,我们以后做能源的这个重点学科网格,实际上是一朵能源的云,就是说它是比较专用的,不是比较通用的。

第三个差别,过去机器12个学校连起来,12个学校的使用权是谁呢,是12个学校的校长。连到一块,这12所学校。现在我的体会,这个机器使用权基本上属于这个单位,你看Google,Google这件事情,Google这朵云是做搜索的,百度这朵云得是做搜索的。他们两朵云他们不可能连在一块,自己干自己的。因此这个差别,从技术角度来说,我觉得没什么差别,都是用并行和分布处理技术。

我想问一下,因为我们说网格的通用的计算的要求,是不是需要里面的节点的架构必须要一成不变的、统一的,比如说是X86的就都得是X86的,以后可能就不会用到RISC,或者说混合异构的系统是不是很难进入到CG的版图里?

郑纬民:不会,我们一般情况下,比如12个学校连起来,也要12个学校都有机器,连在一块,没有说一个问题,都到12个学校去做一件事,那倒希望同构的机器做起来省事一点。如果异构的没问题,这个问题得直接讲,另外的问题另外讲。没有说一定是哪一种机器。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章