科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网服务器频道高性能计算走出中国超算的“凌波微步”

走出中国超算的“凌波微步”

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

在《天龙八部》中,段誉经常借助凌波微步来巧妙的避过敌人的封堵,为自己的最终胜利奠定了有利的基础。在最近的一段时间里,由于中美之间的超算(Super Computing)风波,我真心觉得——凌波微步 中国超算值得拥有。

来源:ZDNetserver频道【原创】 2015年4月24日

关键字: 英特尔 天河二号 超算

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共4页)

中国超算的凌波微步:太极生两仪 两仪生四象

如果站的美国的角度,出于私心的考虑,美国限制中国4个超算相关机构购买至强芯片进行系统升级,其实是“可以理解的”,换作是中国,也可能会这么做。因此在这件事上,美国政府的决策有其道理,英特尔以及其他可能被限制交易的美国IT公司也是无辜的。

其实,对中国进行技术管制,在中国相关的科研工作者来说,已经是习以为常的事情。在2015年4月19日,在由中国计算机学会青年计算机科技论坛(CCF YOCSEF)在京举行 “芯片限售对我国超算的影响”特别论坛上,讲学嘉宾之一,中国龙芯系列处理器负责人、中科院计算所研究员胡伟武就表示,“对中国的限制比比皆是,比如中芯国际的进口集成电路生产线不能用于生产高端芯片和用于航天的器件,但这些限售令有助于中国破除依赖幻想。中国人只要丢掉了幻想,什么人间奇迹都可以创造出来。斯诺登事件、XP停止服务事件,以及这次的禁运事件对自主软硬件发展都有促进作用。”

另一位论坛嘉宾,天河二号系统主任设计师、国防科技大学教授卢宇彤也坦言,这件事对她来说并没有什么大不了的。“我们不需要对此事过度解读,只需专心做好自己的本职工作。中国超算领域还有很多工作要做:做好下一阶段超算发展规划,做好核心元器件的研发与产业化,做好现有几个超算中心的应用服务,做好国产大规模高性能超算应用的培育与研发,更重要的是要构建一个系统、应用与人才并举的生态环境”。

事实的确如此,美国的限售让我们必须明白一个道理,你自己必须拥有自己的“计算器”才能踏踏实实的“终极大考”,总是借别人的计算器只能是一厢情愿,在别人不愿借给你的时候,一方面继续用好手中的算盘,另一方面就是要尽快具备拥有计算器的实力。从这个角度说,中国政府一直强调的自主、可控是绝对有意义的明智之举,它将带给中国更大层面的“安全”。这一次的超算风波,显然将进一步加强中国自主研发超算系统相关组件(不仅限于处理器)的决心,从长期来看,这对中国超算事业的健康发展绝对是好事。

而我所说的“凌波微步”,其根本目标也就是规避国外封锁,凌波微步起源于易经八卦,八卦又源于太极。那么太极生两仪、两仪生四象也恰恰能代表我想说的总体战略。不过,凌波微步的介绍中也强调了:凌波微步每踏出一步,都与内力息息相关,决非单是迈步行走而已,若无内功根基之人,将凌波微步强行走将起来,会造成自绝经脉的危境。因此,足够的内功是绝对必要!

如果将太极比作是终极恒定的目标(让对手的封堵无效),那么太极生两仪即是指要达成这个目标的两个主要支柱:人和事,即由什么样的人,干成什么样的事,在具体的实施中,则是两仪生四象,也就4个战略层面的人和事,我认为它们分别是:国家战略、技术研发、市场生态与舆论维护。

走出中国超算的“凌波微步”

这其中,中国超算发展的国家战略无疑是最重要的,它将影响到底下3个层面的具体运作,其根本的出发点就是以应用为根本导向,制定合理的长期发展、扶植、实战与人才规划,并尽量借助市场的力量,刺激整体的战略执行。这基本也是我所接触到的中国超算学者们的普遍共识。

在日常生活中,我们都知道不装任何软件应用的电脑就是一堆高级垃圾,因此应用的水平至关重要。中国现在的超算硬件平台的系统集成与构建能力已经达到国际先进水平,但应用能力还有非常巨大的差距,极端点说有点像古代战舰与核动力航母间的差别。而这一切也都源于中国相关人才的匮乏。
 
在交流中,北京航空航天大学教授钱德沛系统的分析了其内在的逻辑,“面向某一领域的超算体系其实是一个系统的工程,涉及多方面的科学技能,而非简单的计算机本身的实力”在谈到超算的具体应用时,他表示,“超算的根本目的在于利用已知的规律来研究未知的世界,而在这一过程中需要不同领域的人才共同配合”。他解释到,“首先是应用领域的人,他自己要明白要解决什么问题。第二个是数学家,他要能建立起数学演算模型。第三个是计算机的科学家,根据数学模型,结合硬件平台的架构设计计算机算法来完成超算程序的研发。所以怎么样能培养各个学科的人才,让各个学科的人在一起做事情,甚至形成一种交叉的学科,这是需要认真对待重要问题。”

当前的现实中,很多需要超算平台的其实是相关领域的研究学者,比如物理专家、气候专家等,但他们并不是数学家与计算机专家,他们很多研究的想法并不能有效变成超算应用,所以也就制约了他们的研究能力。另一种典型的现象则是,即使是有了数学与计算技能的帮助,实际的计算环境又很难跟上。有一个极端的例子,某大学的学者用200台PC组成集群进行模拟计算,但这200台PC的能力,远不能真正的超级计算机相比。比如上文讲到的SUMMIT超级计算机,其最低的150PFLOPS峰值性能,相当于300万台笔记本电脑,而当那位学者后来有机会能用到超算时,很可能发现原来基于200台PC编制的程序,在如此大规模的平台上反而变得不可用了,这又涉及到超大规模编程能力的问题。

事实上,中国超算应用普遍的应用规模的确不大,据广州超算中心(天河二号)的应用统计,虽然其硬件平台的性能位居世界第一,但跑在上面的应用大都是小分区的,即部署规模主要集中在百核级,到了千核级就少了很多,万核级就更少了。也因此,超算中心的人也极力呼吁“大家来大规模的用我”,希望有更多的上万核、十万核的应用跑在上面。对此,钱德沛则表示,“我们的超算应用的水平一直在加速,实际上中国这几年进步还是很快的。2002、2003年时候的系统已经算并行系统了,我们现在“十五”做到了几百核、上千核。“十一五”做到几万核以上,“十二五”现在做到30万核以上,实际上有的已经到百万了,进步还是很快的。如果有这样一个趋势的话,应用会发展比较快。但是有一点,就是人不够,大学培养的人不够。”这又回到了上面的人才培养战略问题。

然而,在一些科研学者看来,对于大规模并行超算应用的实际运行,则有另一番苦衷。中科院计算机网络信息中心副主任兼超级计算中心主任迟学斌表示,“中科院的一些研究课题应用,可以达到30万核的需求规模,但如果放在天河二号上跑,成本是一个很大的问题, 一个核一小时一毛钱,30万核,算一小时3万块钱没了,而且一算算好几个小时,费用是很高的,所以里面有很多矛盾。”

对于这种矛盾,张云泉表示,“建议成立若干并行软件国家工程中心,统筹全国各行业并行软件的研究、开发、推广和应用,同时对已经设立的8家国家超算中心,应纳入国家科技部的基础设施范围,给以持续经费支持,发挥长期效益。”,胡伟武则进一步建议国家出资建造专门为大学教授免费使用的大型超算中心,降低科研的成本压力。钱德沛则认为是否免费并不是最重要的,国家的扶植策略应该更加的有的放矢,重点放在国家整体的超算中心的布局上——“作为一个国家的基础设施来说,应该是金字塔型的。像高端的少数几个中心在塔尖上,中间一大块是像P级、100T以上的这种系统,到底下各个部门都有自己的系统。上面这些中心都跑大应用,中间跑比较大的应用,底下跑的是自己调试用和实验用。但是我们现在没有形成这样一个结构,大中心也在跑小的,原因是底下可能也没有建立起来,或者用的也不方便。

走出中国超算的“凌波微步”

由此可见,中国超算发展战略,需要完善的地方还有很多。而另一方面,既然美国政府为自己的利益做出限售的决策无可厚非,那么同样站在中国的立场上,也应该有相应的反制措施。对此,中国计算机学会(CCF)秘书长杜子德表示:中国计算学会在今年3月份向全国人大常委会法制工作委员会、国务院法制办公室提交了“中国计算机学会关于制定《反禁运法》的建议”,建议有关部门尽快制定《反禁运法》,其他国家对我国禁运的装备、器材、技术及软件等在我国研发成功之后,一定时期不得进口该国的同类产品或对其征收高额关税,以此作为反制措施,保护我国的国家利益、民族产业利益和科技人员的积极性。透过这次美方芯片限售事件,进一步凸显制定《反禁运法》的重要性和必要性。

接下来就是相应的技术平台选型与重点突破了,这与市场生态要紧密结合。而在中国,并不缺乏这方面的尝试。就中国自主CPU的产品成果,可以说是百花齐放,但凡是可获得授权的主流CPU架构,中国基本都尝试了一遍,不过我对此做法持保留态度,因为这样的状态可能分散了中国现有宝贵的研发资源,反而增加了各CPU体系的发展阻力。事实上,目前中国CPU的综合水平,离国际领先水平还是有非常明显差距的,也许集中一两点(技术架构)突破,可能会取得更好的效果。

走出中国超算的“凌波微步”基于SPARC处理器架构的银河飞腾1000处理器,由中国人民解放军国防科学技术大学主持研制,8核心/64线程,主频1GHz,应用于“天河一号A”

走出中国超算的“凌波微步”由国家高性能集成电路(上海)设计中心自主研发,采用自主指令集的申威(SW)-1600处理器,16核心,主频最高1.1GHz,应用于国家并行计算机工程技术研究中心所打造的,神威蓝光(Sunway BlueLight MPP)超级计算机

走出中国超算的“凌波微步”基于MIPS指令集授权的龙芯处理器(图中为龙芯3B-1000),早前深圳超算中心,曾装配了基于龙芯3A构建的超龙系统,性能达几百万亿次(0.xPFLOPS级别)

走出中国超算的“凌波微步”国产POWER处理器发展路线图,第一代产品将于2015年12月推出,12核心,去除IBM的安全模块,对标英特尔E5-2690,2017年12月推出第二款芯片,集成自主的浮点运算单元,对标英特尔E5-2620、2650,从这一代产品开始才是真正安全可控的国产自主POWER处理器,不过是否会有厂商把它带入中国超算市场还是个未知数。但在本文中,我并不想过多提及中国版的POWER,毕竟它的仍然是由美国IBM把控的技术,严格的讲,还不能说完全的中国自主CPU,不能像上述三款产品,能从根本上摆脱国外可能的掣肘

上述除了国产POWER外三款中国自主研发的处理器,离普通百姓很远,我们基本没有可能在日常应用领域看到它们的身影,但这并不代表它们没有市场。其实在对安全、保密有严格要求的中国政府相关部门及军事领域,它们都有不错的表现。其中龙芯据称已经几百万片的出货,集中于敏感政府部门的桌面系统、网络安全系统、军事指挥系统、军用嵌入式设备以及航空航天领域,不久前的中国北斗导航系统采用龙芯处理器的新闻就是一例,此外还有民用领域的机顶盒市场。因此,在一个相对小众但稳定的市场里站稳脚跟,对于国产处理器来说并不是难事,因为安保的需求是不可替代的,也是高于性能的优先需求。因此,我也不认为它们需要急于进入主流通用市场来证明自己的成功。

“关键还是要先充分用好”,龙芯系列处理器负责人、中科院计算所研究员胡伟武对此很有感慨,“我们的编译系统的落后国际领先水平3-5倍,我们的处理器微架构落后3-5倍,主频频率则落后1-2倍,这都是现实的差距”但是,胡伟武话锋一转,“如果我们建立起自己完善的生态系统,在这个系统里不断优化创新,仍然能取得很好的性能。”他举例到,苹果的CPU性能比英特尔差很多,但苹果产品的体验却很好,这就很能说明问题。“例如某数据库应用,在x86服务器上用时50分钟,龙芯服务器没有优化前是8小时,优化后是80秒,又比如某图形应用,英特尔i7平台每秒40帧,龙芯平台优化前每秒不到一帧,优化后则是每秒80帧。”所以,不要急于求成,盲目否定自己。而且,龙芯经过多年的发展,某些关键性能已经有很大的进步。

走出中国超算的“凌波微步”龙芯3B-1000处理器(8核), 1GHz下实测的浮点峰值性能在122GFLOPS。英特尔i7 4770K(4核/8线程) 3.9GHz的实测浮点性能则为86.36GFLOPS(来源:http://www.szpco.com/shm/26646.html),也就是说浮点性能i7 4770k同频率也只有龙芯3B-1000的18%,接近1/5

如今,中国主要的三款通用处理器均有超算系统给的成果,接下来是看他们如何竞争中最后的强者,还是说从国家战略层面重点从某个技术路线突破,并配以相关的市场扶植政策,就看主管部门的抉择了。但不管怎样,中国自主处理器的发展,一直在以大多数国人并不知晓的状态下“沉默前进”,并为中国超算的发展提供着越来越强的支撑力量,也因此,天河二号系统主任设计师卢宇彤非常自信的强调,“按照原定计划,天河二号拟在今年将计算能力从55PFLOPS升级到100PFLOPS。尽管此次美方对天河二号升级所需Intel Xeon处理器的限售,对原定升级计划有一定影响,但我们早有准备,绝不会影响天河二号从55PFLOPS升级到100PFLOPS的既定目标 。

但是,不可否认的是这种“沉默是金”的状态,并不能营造出有利于国产CPU发展的社会环境,现实中的大众很多都对国产CPU持负面看法,认为是劳民伤财、官商勾结的面子工程。这就涉及到最后一个层面:舆论维护。

舆论本身是中性的,但似乎中国的科技工作者并不看重它可能迸发出的正面作用,对于媒体记者很有警惕性,甚至怀有敌意。我身边的一位媒体朋友,就曾经因为早期报道龙芯处理器时,提了一些意见,稿件就被封杀了,龙芯在这位记者心目中的印象也就可想而知了。这种对媒体似乎近似天生的不信任、不重视感,以及认为舆论应该一边倒表扬赞美的想法,在我看来,是急需修正的。

在“芯片限售对我国超算的影响”特别论坛的讨论环节,我对此问题第一个发言——虽然中国超算精英们根本没把这次风波当回事,早有预料和解决方案,但中国很多媒体们却“大惊小怪”了一把,这有专业对口与积累方面的原因,但更多的,在我看来是中国超算领域的相关领导者,在日常舆论维护方面几乎缺失的必然现象。当然,一些业内人士、专家的迅速反应,与媒体耐心沟通解释,起到了很好的效果,“芯片限售对我国超算的影响”特别论坛允许媒体人员参加就是非常值得称赞的。

走出中国超算的“凌波微步”“芯片限售对我国超算的影响”特别论坛与会成员合影,我站在最左边(左一),其他参加会议的媒体包括IT168、中央电视台、新华社、人民网/人民日报、环球网/环球日报、中国新闻网、中国青年报、新浪科技、腾讯网等,在此再次感谢论坛的组织者对媒体开放的态度

 

舆论维护的一个重要根基就是信息尽可能的透明,及时沟通,相信多数记者的爱国热情与职业操守。在此基础上要分方向,对不同领域的媒体传达不同的信息。比如党媒、官媒重点阐述总体思想与宏观战略,对于财经、商业媒体重点讲述商业理念与核心价值,面向技术媒体着重介绍技术架构、特点与优势,形成垂直而立体的舆论导向,让正确的信息在不同层面上均获得有效的传播。同时,还应平静客观对待媒体非恶意的负面观点,一味的表扬与赞美其实只是“掩耳盗铃”。最重要的是,培训相应的PR沟通能力,在媒体面前不说大话、假话、空话,实事求是,也就不怕媒体日后“挖坟”,进而丧失信用,最后进入彼此猜疑、不满与决裂的状态。

 

总而言之,良好的舆论维护,将确保社会层面对中国自主超算发展的客观认识,营造一个更利于发展的社会环境,增强市场的信心,这也将有助于生态环境的建设,否则一些可能的市场合作企业,也许就因为信息不透明或者是舆论的误导而错过做大生态圈的机会,最后受损失还是国产自主CPU的发展。

最后,我衷心的祝愿中国超算从此能稳健走出“凌波微步”,不受困于外围,再配以“六脉神剑”(领先的超算应用),像“段誉”那样,笑傲全球超算江湖!

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章