6月24日-28日,2018国际超算大会(ISC18)将在德国法兰克福会展中心举行。作为超算领域最重要的国际性会议之一,ISC18将重点展示HPC最新技术及其在科学领域和商业环境中的应用,主要议题包括人工智能与HPC、Exascale超算系统、量子计算机的未来应用、大数据分析、HPC的云计算新特性、编程模型和语言的未来挑战、基于容器的HPC的兴起等等。高质量的学术报告与重量级的产品方案展示,将吸引全球数千名工程师、IT专家、系统开发人员、供应商、科学家、研究人员、学生以及高性能计算(HPC)全球社区的其他成员参会。
业界专家认为,最快超算之争、中国和AI将是本次国际超算大会看点的关键词。
美国为何提前发布全球最快超算?
美国时间6月8日,美国橡树岭国家实验室宣布新的超级计算机Summit落成,峰值计算性能突破20亿亿次每秒(200 PFlops),成为全球最快的超级计算机。这台计算机是由IBM总包设计建设,采用了9216颗IBM Power9处理器和27648颗Nvidia Volta的GPU加速器。
有专家分析,美国没有选择在6月25日与最新一期Top500全球超算排行榜同期公布而是提前发布的原因,可能是因为Top500名单的申请日期是截止到6月8日--所以6月8号已经可以确定本期排行榜申报名单中没有比Summit性能更高的超级计算机。因此美国可以提前进行发布宣传,这也是对美国时隔5年后重回Top500榜首的热烈庆祝。
当然,对于这次Summit超算,还有待解之谜需要等待ISC18大会揭晓。比如最关键的指标--实测计算性能是多少?Summit的200Pflops是理论峰值性能,但是其实测Linpack性能能达到多少呢?目前尚未公布。此前最快的超算中国的神威太湖之光的理论峰值性能是125PFlops,实测性能93PFlops,效率74.16%,这在世界顶级的超算中实属难得的高效率。不过按之前Volta GPU架构超算来推算,这次summit的Linpack效率应该不会高过太湖之光。而Summit的HPCG性能、实际应用性能表现等更多谜底也将待ISC18期间揭晓。
值得注意的是,ISC18大会期间6月26日下午举行的第19届HPC Connection Workshop国际超算高峰论坛,将有来自美国Summit超算项目和神威太湖之光的专家同场演讲交流,为听众揭示更多中美最快超算的技术细节。
中国超算依然是关注热点
即便本次大会中国不再蝉联Top500最快超算,但中国超算依然是全球的关注热点。很多国外专家依然很好奇在猜测中国是否会有比太湖之光更快的超算上榜?中国的E级超算何时会交付?这些关注其实反映了中国超算实质上已经成为世界领域最重要的两极之一。据悉本次大会上,来自中国的神威和天河超算均将分享最新的技术与应用进展。
这几年伴随中国超算蝉联Top500榜首的另一个让人关注的成绩是中国大学生超算队伍,他们在三大超算赛事(ASC、ISC和SC)多次取得出色成绩的表现让人赞叹中国的超算人才后继有人。这次代表中国出战ISC18竞赛的有清华大学和上海科技大学。此前,清华大学已获得3届ISC超算竞赛冠军、5届ASC超算竞赛冠军和1届SC超算竞赛冠军,是目前唯一一支实现了ISC、ASC和SC三大国际性大学生超算竞赛"大满贯"的队伍。这次清华大学是否能如愿夺冠从而成就为十冠王呢?而夺得ASC18亚军的"黑马"上海科技大学又将有什么样的上佳表现?让我们拭目以待。
ISC大会同时也成为中国超算厂商展示自身领先产品的舞台。在ISC16上,浪潮和英特尔联合启动"Keep"计划,宣布共同建造基于全新KNL技术的、开放的高性能计算系统,帮助更多高性能计算和深度学习用户在KNL上完成应用测试、迁移及优化。ISC17期间,浪潮重磅发布了新型AI加速计算产品GX4,实现CPU与GPU协处理加速资源解耦并可随需扩展计算性能,为多样化的AI应用提供极具弹性的加速计算支撑。据悉在今年的ISC18上,浪潮又将带来重量级的新品发布,值得关注。
机器学习日延续AI热潮
6月27日的机器学习日是本届ISC大会设置的两大专属议题探讨日之一(另外一个是6月26日的工业日),这毫无疑问地表明HPC与AI的融合趋势还在加速。这个从美国Summit对外宣传的重点是其对AI计算的强大支持就可以看出来。
在过去的几年中,机器学习和AI已经成为HPC社区中的重要话题。这也是几乎所有厂商都极为重视的机遇,以抓住AI和HPC融合解决方案的这个新的高速发展的市场机会,而传统的HPC用户越来越多地将AI技术整合到他们的工作流程中,以加快处理速度并获得更多科学洞察。
机器学习日将由弗劳恩霍夫工业数学研究所(ITWM)的Janis Keuper和劳伦斯-利弗莫尔国家实验室(LLNL)的Brian van Essen共同主持,探讨的议题主要包括机器学习应用程序如何改变HPC体系结构、面向HPC系统的可扩展机器学习的挑战、基于HPC的机器学习软件以及商业用户和研究人员如何应用机器学习技术。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。