联想今天宣布将与英特尔合作,优化其数据中心技术以实现高性能计算和人工智能之间的融合。
作为全球超级计算机500强中多套系统的打造者,联想认为自己的高性能计算基础设施是应对全球最大计算挑战的理想平台,而人工智能软件则是独一无二的解决方案。但最先进的人工智能算法也需要大量的计算能力,联想认为,通过优化其基础设施以采用英特尔最新的处理器技术,可以获得强大的优势。
为此,两家厂商今天宣布达成一项“多年全球合作”,以加速高性能能计算和人工智能的融合。此次合作建立在双方现有的关于将联想Neptune液体冷却技术与英特尔第二代Xeon Scalable处理器相结合(全球500强超级计算机中有173套系统采用了这种硬件组合)的合作伙伴关系之上。
两家厂商表示,展望未来,该计划旨在利用英特尔技术——包括Xe计算架构、Optane DC持久内存、oneAPI编程框架以及Xeon Scalable处理器(采用了名为“Deep Learnig Boost”的嵌入式人工智能加速器)优化联想基于云的TruScale基础设施服务。
除了硬件外,双方还将重点关注为下一代基础设施提供支撑的软件。联想表示,将基于英特尔技术优化自己的LiCO HPC/AI软件堆栈,并与英特尔oneAPI框架保持一致。双方还将合作开发新的“DAOS高级存储框架”,帮助应用更轻松地运行在高性能基础设施上。
“我们的目标是进一步加速创新进入百亿亿(Exascale)级性能时代,积极向科学家和各种规模的企业提供这些解决方案,以加速科学发现和结果获取,”联想执行副总裁、联想数据中心集团总裁Kirk Skaugen在声明中这样表示。
Constellation Research分析师Holger Mueller表示,联想与英特尔之间的合作非常重要,因为该行业中很少有厂商能够自行创建下一代高性能计算系统。
Mueller说:“处理器和系统制造商之间的紧密合作[对于这些系统来说]是基本要求。CIO们将密切关注该合作伙伴关系的能力、性能和用例,特别是人工智能大行其道的当下。”
最后,双方还宣布将在全球多地建立联合的高性能计算和人工智能卓越中心,向大学和其他研究人员提供这些服务以解决人类面临最紧迫的一些挑战,例如基因组学和癌症研究、天气和气候变化、太空探索等。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。