位于美国科罗拉多州戈尔登市的美国国家可再生能源实验室(https://www.nrel.gov/)宣布选择惠普企业公司(Hewlett-Packard Enterprise Co.)建造一台新的超级计算机,计划用于推动实验室的能源效率研究。
今天宣布的“Eagle”超级计算机将于今年夏天进驻美国国家可再生能源实验室(NREL)的一个数据中心,明年1月上线。 NREL表示,超级计算机的功能比现有的高性能计算系统强大3.5倍,而且能效更高。
NREL是个联邦政府实验室,致力于研究能源效率和可再生能源。NREL由美国能源部资助,但由外部承包商经营。
NREL安装的Eagle超级计算机将用于运行详细的系统模型,模拟各种不同能源的复杂过程和系统,包括风能源以及“车辆技术”等。
风力发电方面,NREL计划利用Eagle分析受大气和可变地形影响的子系统方面的挑战和系统级相互作用。有关官员称,实验室汽车技术方面的研究涉及先进电池和其他电气化创新。
HPE SGI 8600系统的目标是提供以“Petaflop(千万亿次浮点计算)速度”运行的复杂HPC工作负载。Eagle超级计算机将由SGI 8600系统驱动。Eagle超级计算机的冷却用的是一个新的“温热液体冷却系统”,HPE认为该系统可以捕获97%的废热以供再次利用。
Constellation Research公司副总裁兼首席分析师Holger Mueller表示,“高性能计算对下一代应用的前景有重要意义。NREL用大型机器可以实现很多东西,是个很好的例子,而这对于HEP业务和能源研究来说均是个不错的收获。“
HPE一直与DOE(美国能源部的英文缩写)有长期合作关系,合作中的DOE用到先进的超级计算和HPC解决方案,以加速其数十家机构的研究。
HPE今年6月曾表示正在与美国能源部和桑迪亚国家实验室合作建造世界上最大的基于ARM的超级计算机芯片架构,Eagle超级计算机则是基于x86架构。该超级计算机名为Astra,美国能源部的国家核安全管理局将使用Astra运行先进的模型,达到改进国家安全和能源等领域数据密集型科学实验的分析的目的。
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。