在“东数西算”战略要求,和AI产业应用需求驱动下,先进存力已成为数字经济高质量发展的关键要素。今年,工信部等六部门联合发文,要求2025年我国存储总量超过1800EB,先进存储容量占比要达到30%以上。
作为首个提出先进存力概念,并率先展开布局的存储厂商,曙光存储正在赋予先进存力更丰富的价值内涵。根据赛迪最新发布的《中国先进存力发展研究报告》(以下简称“报告”),基于存储技术、生态及方案部署等方面实践成果,曙光存储多项评估指标领先业内,已位列国内先进存力第一阵营。
五大价值体系,重新定义先进存力
《报告》指出,曙光存储依托全栈自研的技术优势,为中国液冷存储、大规模存储部署提供了宝贵经验。目前,曙光存储已形成“绿色、海量、高效、融合、安全”等五大价值体系,进一步刷新“先进存力”的定义。
绿色:首创液冷存储系统,成功部署首个存算一栈式液冷数据中心,实现PUE值1.2以下,补全了绿色数据中心最后一块拼图。
海量:EB级存储架构,拥有多个超百PB大规模部署案例,持续刷新单套存储部署规模上限。
高效:全链深层优化,可实现超高吞吐及IOPS能力,以极致性能支撑各类高性能复杂应用。
融合:集四种接口协议于一体,真正做到异构数据的融合管理,可适配不同业务场景需求。
安全:凭借全栈自研核心技术,曙光存储提供从软件到硬件全自主、全流程可控的存储方案,全力保障数据存储安全。
四项指标领先,精准赋能应用落地
基于对先进存力市场和存储厂商的追踪调研,《报告》从六大维度构建了先进存力厂商的评估模型。根据评估结果,曙光存储在数据流动性、安全性、可靠性以及技术前瞻性等四项指标各占鳌头,综合实力位列中国厂商之首。
依照该评估模型,技术、生态以及安全性等指标,已成为先进存力的准入门槛。同时,各项指标中的表现,也直接反映出存储厂商在应用市场的落地能力。
曙光存储凭借完善的价值体系,无疑精准命中了应用市场的场景需求。《报告》显示,2021-2023H1,曙光在中国液冷数据中心基础设施市场部署规模位居第一,占比达58.8%。2022年,曙光存储在智算中心和气象环保市场表现突出,均居于领先地位。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。