HPE正在欧洲打算首个AI系统工厂,并称此举将“孵化众多AI和ML项目,加速创新”。
该工厂位于捷克的库特纳霍拉,毗邻捷克的欧洲服务器和存储制造厂。工厂将于今年夏天开放,还将负责生产下一代高性能计算系统。
HPE公司执行副总裁、高性能计算和人工智能总经理Justin Hotard表示,库特纳霍拉的这家工厂将让HPE在制造硬件的同时,“提高供应链的活性和弹性”。
这个工厂也将成为HPE全球第四个高性能计算制造基地,上一个制造基地是HPE与富士康联合创建的。富士康是台湾代工制造商,与苹果、小米和耐能都有合作关系。
该工厂将主要生产和出货两种产品:HPE Apollo系统和HPE Cray EX超级计算机。
Apollo专为高性能计算应用设计,包括AI建模和训练。2000 Gen10 Plus版本可以在一个2U机箱中支持多达4个热插拔服务器。
Cray EX则是一种液冷的、基于刀片的高密度集群系统,它的机柜是密封的,因此排出的热空气不会散发到数据中心中——尽管每个机柜重达8000磅。
Cray EX将为全球最强大人工智能超级计算奠定基础。由英伟达、HPE和瑞士国家超级计算中心(CSCS)共同开发代号为“Alps”的系统预计将于2023年上线,用于量子化学和天体物理学等领域的研究。2019年HPE以14亿美元的价格收购了超级计算机公司Cray。
HPE在声明中表示:“这两条产品线均提供端到端的高性能计算和人工智能功能,涵盖了计算、加速计算、软件、网络、存储和液冷等功能。”
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。