这台Cray EX性能巨兽有望改善新加坡的天气预报准确度
HPE再拿下一份超算大单,这次是为新加坡气象局提供算力支持,协助新加坡和东南亚地区改进天气预报和热带气候研究。
这台新型超级计算机同样基于Cray EX架构,并搭载AMD Epyc处理器。可以看到,它跟目前全球排名最高的美国Frontier百亿亿次超级计算机使用同样的核心处理单元。
根据HPE的介绍,这套新系统顺利将新加坡气象局的算力储备翻倍,峰值性能可灰401.4万亿次。它将负责改进数据模型配置,并利用气象局的SINGV数值天气预报系统分析陆基与天基观测结果,借此提高预报准确性。
SINGV由新加坡气象局下辖的新加坡气候研究中心(CCRS)与英国气象局等机构共同开发,专门针对新加坡及周边地区的天气预报和气候应用进行配置。
HPE宣称,这台全新超级计算机的性能足以运行增强的预测后处理算法,其中利用机器学习技术来提高预测质量。由于算力更强,其还能承载更高分辨率的模型以改进天气与气候数据质量。
新系统的应用案例之一,就是耦合型海洋-大气-陆地-海浪建模系统(cSINGV)。HPE表示,这类系统能够更好地跟踪大气、陆地与海洋之间的强反馈效应,发现对东南亚地区天气和气候有重大影响的因素。
新加坡气候研究中心主任Dale Barker教授表示,这台新的超级计算机是由该机构合作设计,旨在加快处理速度、支撑下一代技术,从而推进建模与住址工具的升级。
他解释道,“我们的科学家和软件工程师致力于开发出先进的建模系统、检查复杂数据,以便为我国提供及时准确的天气预报。由于新加坡独特的地质定位,单日之内往往会经历多种天气过程。”
这台新超算在体量上自然远无法与百亿亿级Frontier超级计算机相媲美,其只包含196块AMD第三代Epyc处理器,但使用到了HPE的Slingshot高性能网络结构和Cray ClusterStor E1000并行存储互连等Cary EX设计方案。
奇怪的是,HPE和新加坡气象局都没有提到GPU,照理来说纯数字运算算法应该是GPU大显身手的理想场景,而且其他Cray EX系统也都有应用。包括Frontier、沙特阿拉伯的KAUST和芬兰的LUMI超级计算机,均搭载有GPU组件。
HPE称这一超级计算套件将带来强劲的计算性能,用以实现气候数据的模拟和住址、加快全局天气预报速度。
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。