2021年10月21日,珠海 —— 2021 CCF全国高性能计算学术年会(HPC China 2021)于今日正式拉开帷幕。此次会议期间,英特尔及其合作伙伴就如何通过高性能计算应对当今世界的重大挑战展开探讨,并展现了英特尔如何通过IDM 2.0战略及XPU战略共塑高性能计算的未来,在数字化浪潮席卷全球之际,凭借“四大超级技术力量”释放数据潜力,加速技术演进,为客户提供更灵活的计算基础架构,从而引领高性能计算迈向E级计算时代,创造造福人类的前沿创新。
英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉
英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉表示:“为应对由大量数据及其他因素带来的更复杂挑战,人们对高性能计算系统的需求高于以往任何时候。英特尔提出的‘四大超级技术力量’各具特质,也相得益彰,这不仅是我们对底层、技术、架构、演进的思考,也代表未来数字经济在不断演进的过程中将充满无限可能。结合四大超级技术力量的发展,英特尔全新产品组合正在帮助我们的最终客户和合作伙伴为不断增长的HPC市场构建全新解决方案,并共同应对新的挑战。”
随着数据呈指数级增长,高性能计算的重要性与日俱增。以更有效的方式移动、存储和分析这些数据对于帮助全球专业人员做出实时、数据驱动的决策至关重要。为此,英特尔提供具备从通用计算到专用加速,再到独特持久内存和E级计算分布式存储、高性能互连及创新安全等功能的全面产品组合。通过使这些功能无缝协同工作,英特尔可为HPC创新提供整体系统性能。
作为HPC和AI的基础,第三代英特尔®至强®可扩展处理器是数据中心唯一内置AI加速功能的x86处理器,可提供多达40个核心,每插槽最多可支持6TB系统内存,高达8个DDR4-3200内存通道和64个第四代PCIe通道,来为用户提供可靠性能和高度灵活性,并为高性能计算系统性能带来巨大飞跃。此外,专为数据中心设计的下一代英特尔®至强®可扩展处理器Sapphire Rapids具备分区块、模块化SoC架构核心,采用英特尔嵌入式多芯片互连桥接(EMIB)封装技术,将为数据中心的各种工作负载、使用模型和部署模型提供出色的开箱即用的性能和功能。Sapphire Rapids 还是第一款使用Silicon Bridge技术构建的至强产品,该技术使英特尔能够构建之前无法实现的高度可扩展和均衡的处理器。随着高性能计算和人工智能的融合,Sapphire Rapids 提供的高级矩阵扩展(AMX)能力将显著提高深度学习、推理和训练性能。与此同时,英特尔用于E级计算和AI的GPU Ponte Vecchio采用 47 种不同芯片模块,并利用英特尔先进封装技术在封装内集成包括HBM在内的多个IP,可提供高性能计算应用所需的纵向及横向扩展能力。
英特尔广泛的产品组合带来的异构性也提高了对可扩展软件的需求。基于此,英特尔推出oneAPI项目以简化跨CPU、GPU、FPGA、AI及其他加速器的各种计算引擎编程,来应对这一挑战。英特尔oneAPI工具包可提供编译器、库和分析工具,支持 AMX、VNNI/DL Boost 指令和内存技术等功能,能够为各种应用程序和工作负载提供支持。
此外,高性能计算和AI的不断融合也为高性能计算系统带来更多用户和用例,使高性能计算无处不在。英特尔始终和众多生态伙伴携手通过高性能计算系统创新来解决高性能计算和AI领域的棘手问题,以应对现实世界挑战。
在新冠疫情爆发期间,诸多高性能计算研究中心借助英特尔技术运行分子动力学和模拟,以了解病毒结构并加速新冠相关药物的研发和治疗。与此同时,英特尔还与客户、合作伙伴及政府机构合作改善患者护理并加快治疗和疫苗研发。瑞金医院国家转化医学中心就凭借英特尔面向未来E级计算和大数据HPC趋势发布的DAOS分布式文件存储系统与Intel®傲腾™持久内存的低时延、高带宽、大容量、长寿命、非易失等特性,支撑了临床资源深度分析挖掘系统的高性能存储与计算需求。
长期以来,在不断推动技术创新之余,英特尔也始终专注于高性能计算人才的培养与发展。自2013年,英特尔便开始赞助全国并行应用挑战赛(Parallel Application Challenge)。该赛事旨在普及和培养学生的并行计算思想和并行计算系统能力,提高学生在全球人才市场的竞争力。经过多年发展,全国并行应用挑战赛目前已吸引来自中国40余座城市、350所高校和200多个单位的2000余支队伍参与其中,累计参赛人数超过10000人。
在今年的第九届“英特尔”杯全国并行应用挑战赛(PAC 2021)期间,来自中山大学、上海交通大学、中国科学技术大学、山东大学等多所国内知名院校的24支参赛队伍闯进决赛,参赛作品涵盖流体力学、气象海洋、大气物理等多个热点领域。决赛及颁奖仪式,将于10月22日CCF HPC China学术年会期间举办。未来,英特尔将持续推动产业界和学术界在并行计算及高性能计算领域的技术融合与交流,从技术研发到产品应用以及生态等多个维度发力支持高校教育与人才培养,通过携手中国更多产、学、研机构,助力高性能计算发展驶入“快车道”!
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。