扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
作者:王涛 来源:ZDNetserver频道【原创】 2012年9月24日
关键字:
ZDnet至顶网服务器频道 新闻资讯(文/王涛):2012年9月21日,浪潮高性能计算用户大会在泉城济南举行。本次大会以“根植应用 引领创新”为主题,来自国家863专家、国家超级计算济南中心、国家超级计算天津中心、中国科学院、上海交通大学、中国海洋大学、浪潮集团、英特尔、迈络思等业内顶尖专家和中国各行业高性能计算用户代表,就中国高性能计算的应用创新与技术发展、软件开发和算法优化、系统运维管理等议题展开了深入探讨,并共同探索中国高性能计算的技术创新与应用发展方向。
北京航空航天大学教授钱德沛
会上,北京航空航天大学教授、国家863计划高性能计算机及其核心软件重大专项总体组组长钱德沛发表了专家致辞。钱德沛介绍,在过去的十年中,中国高性能计算机发展迅猛,运算峰值不断被刷新,从2001年实现4000亿次/秒计算速度,2004年实现11.2万亿次/秒计算速度,2008年实现200万亿次/秒计算速度,2012年实现4700万亿次/秒计算速度,就中国而言,10年间高性能计算速度增长超过1万倍。
随着科学技术的快速发展,高性能计算正将一个个看似不可能完成的任务转化成现实,并经历了从千万亿次向亿亿次的跨越,如今,实现百亿亿次(Exascale)计算速度成为业界共同的目标,但是计算能力的提升对超算机的性能也提出了更为苛刻的要求,钱德沛认为,实现百亿亿次计算机面临几大挑战,分别是功耗、计算性能、可编程性、可靠性。
首先,功耗是制约高性能计算机系统规模扩大的最关键因素,随着系统规模的不断提高,急剧增加的功耗带来了日益突出的系统可靠性问题,电力消耗以及由此带来的高昂运行成本成为高性能计算中心运行的沉重负担。目前,性能提高受限于处理器的性能,多核和众核处理器是主要的实现手段,此外,提高并行规模仍然是提高性能的手段,能否发掘和掌握应用的并行性是有效利用大规模并行系统的关键。随着系统规模的不断扩增,适应大规模并行系统的基础算法及软件实现也制约着性能。
大规模并行系统设备数量巨大,设备的可靠性指标决定了系统的平均无故障时间,在千万亿级系统中,平均无故障时间仅为几小时,随着GPU的引入,使得系统平均无故障时间缩短。当前硬件容错机制昂贵,并将增加系统的规模,软件容错措施日益受到重视,但是也遇到重大障碍。
当然,技术的发展只是一方面,获得广泛而深入的应用才是关键所在,钱德沛强调,对用户而言,更加关注的是获得的性能,而不是峰值性能以及Linpack性能,应用是牵引的力量,供应商应该倾听用户的声音,了解用户需要什么,并用产品和技术来干什么,同时,技术对于应用又具有促进作用,供应商应该和用户密切交流,从而相互启发,相互促进。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。