PE已将其Apollo 4000数据存储服务器系列正式更名为Alletra 4000,并推出两款新产品:Alletra 4110和4120,均配备第四代至强Sapphire Rapids处理器与PCIe 5连接。
除此之外,还有基于全NVMe Primera的Alletra 9000,以及基于Nimble的Alletra 6000与Alletra 5000混合阵列。三种连接形式构成了Alletra产品线下的三个独立存储软件系统。
其中全NVMe Alletra 4110是一款纤薄的1RU双CPU服务器,配备最高3 TB的DDR5内存和最多20个EDSFF(E3.S)或SFF固态硬盘。固态硬盘的PCIe 5带宽高达每秒315 GB。我们注意到Kioxia正在销售E3.S SSD,单盘15.36 TB容量可在20块满载条件下为客户提供307.2 TB存储容量。
4110专为性能密集型工作负载而打造,可作为机器学习的数据存储、分布式/NoSQL数据库、高性能软件定义存储以及数据密集型超融合基础设施。
Alletra 4110
容量更高的混合型NVMe ALletra 4120在2RU机柜内搭载最高6 TB DDR5内存,外加一到两个控制器。作为Apollo 4200 Gen 10服务器的继任者,4120在定位上与Apollo 4200 Gen 10 Plus服务器互为补充。存储选项可以选择前侧24块LFF驱动器,后侧4块LFF、12块EDSFF或者6块SFF驱动器;或者前侧48块SFF驱动器,后侧12块EDSFF或6块SFF驱动器。如果使用PCIe 5 NVMe连接,则数据传输带宽最高可达每秒225.6 GB;使用SAS为每秒24 Gb,使用SATA驱动器则为每秒6 Gb。
至于最大容量,采用48块15.36 TB的SAS SSD可提供734.4 TB总容量,采用24块20 TB SAS SSD可提供480 TB总容量。
其针对跨多个主动分析数据湖、软件定义存储、融合数据保护和深度归档等以数据为中心的工作负载进行了优化。
Alletra 4120
Alletra 4110与4120均提供GPU和FPGA支持。二者包含零信任基础,并通过物理挡板锁、逻辑配置锁、安全启动、FIPS 140-2智能加密、自加密驱动器、AES 256位加密与安全擦除等功能提供安全保障。
HPE Integrated Lights Out 6(iLO 6)负责提供支持,可将硬件信任根从单纯保护服务器固件,扩展至保护指定的存储与网络控制器固件。五重因素身份验证模型则可确保设备正确连接至GreenLake云平台,并由客户管理或作为GreenLake服务使用。
HPE也将推出配备Sapphire Rapids处理器的Proliant服务器,但此次重点发布的Alletra 4000系列强调同时提供存储与计算资源——特别是4110机型,其NVMe驱动器加PCIe 5连接保证了极高的存储性能。至少就目前来看,率先升级的4000系列在存储性能上已经远超Alletra 9000、6000与5000系列。
4110与4120两款机型计划在今年第二季度正式投放市场。
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。