2020年9月28日,北京——2020 CCF全国高性能计算学术年会今天正式拉开帷幕。会上,英特尔就推动高性能计算与人工智能的进一步融合进行了深入分享,展现了通过XPU战略构建融合未来的行业愿景,从而在以数据为中心的计算时代为具有多元计算需求的客户打造更灵活的计算架构,为各类工作负载提供领先性能。
英特尔公司数据平台集团副总裁,高性能计算总经理Trish A. Damkroger在大会演讲中表示:“今年新冠疫情的爆发,让我们更加清晰地认识到高性能计算在当今社会所扮演的重要角色。随着高性能计算与人工智能工作负载的不断融合,英特尔着眼于通过XPU战略,将边缘到云、硬件和软件融入整个生态,引领高性能计算进入更加智能的新时代,推动高性能计算在解决更多社会重大挑战方面担当重任。”
如今,日益丰富的人工智能用例正带领我们迈入计算智能进一步强化的新时代。英特尔意识到,高性能计算和人工智能的融合将是高性能计算行业的一个拐点,而异构性将是加速高性能计算和人工智能融合的关键。为此,英特尔将在今年推出首款10nm Ice Lake服务器CPU,并在2021年推出基于增强型SuperFin技术的下一代至强可扩展处理器Sapphire Rapids,来更加有力地支持深度学习加速以及高性能计算与人工智能工作负载的融合。此外,英特尔还计划推出基于Xe架构的独立通用GPU“Ponte Vecchio”。“Ponte Vecchio”采用7纳米工艺进行制造,并采用英特尔Foveros 3D和嵌入式多芯片互连桥接(EMIB)创新封装技术,可为高性能计算和人工智能工作负载进行优化。
在高性能计算的多条产品线上,英特尔都打造了无与伦比的深度、广度与性能,并在六大技术支柱的指引下为高性能计算领域带来全面的加速与提升。其中,英特尔与生态系统合作推出的OneAPI能够简化跨多种类型处理器和加速器的开发,支持广泛的行业生态系统采纳该技术来推动创新、简化应用开发、实现应用在大量节点上的可扩展性;英特尔革命性的内存和存储技术则能够消除存储瓶颈,为下一代的工作流提供支持。在此之外,英特尔还通过智能互连技术、更高的平台安全性、创新的制程和封装技术和多种先进的架构为高性能计算与人工智能工作负载的融合提供强大支持。
长期以来,在不断推动技术创新之余,英特尔也始终专注于高性能计算人才的培养与发展。
自2013年,英特尔便开始赞助“英特尔”杯全国并行应用挑战赛( “Intel Cup” Parallel Application Challenge - PAC)。该赛事旨在普及和培养学生的并行计算思想和并行计算系统能力,提高学生在全球人才市场的竞争力。经过多年的发展,全国并行应用挑战赛目前已吸引了来自中国40多个城市、300多所大学和160多个组织的1200多支队伍参加比赛,累计参赛人数超过7000人。
在今年的第八届“英特尔”杯全国并行应用挑战赛(PAC2020)期间,来自中科院高能物理研究、中科院计算中心、浙江大学、中国科学技术大学等多所国内知名院校的12支参赛队伍闯进决赛,参赛作品涵盖海洋、生物医药、地质、天文和AI深度学习等多个热点领域。挑战赛决赛及颁奖仪式,将于9月28日至30日在第16届高性能计算学术年会期间进行。未来,英特尔也将持续投入与关注并行计算领域优秀人才的培养,助推中国高校并行计算课程的更新与建设,并将携手中国更多的产、学、研机构,推动高性能计算的发展迈上新的台阶。
好文章,需要你的鼓励
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
微软正式确认配置管理器将转为年度发布模式,并将Intune作为主要创新重点。该变化将于2026年秋季生效,在此之前还有几个版本发布。微软表示此举是为了与Windows客户端安全和稳定性节奏保持一致,优先确保安全可靠的用户体验。配置管理器将专注于安全性、稳定性和长期支持,而所有新功能创新都将在云端的Intune中进行。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。