6月25日,曙光存储召开了主题为“先进存力,凝聚数据要素”的新品暨品牌发布会,震撼发布全球首个亿级IOPS集中式全闪存储FlashNexus,重磅升级分布式存储ParaStor,同时推出行业首个通存解决方案,应对“强无止境”数据存储性能和成本需求。
二十年来,曙光存储自主研发推出多款产品,实现了业务、应用和技术的突破,多项技术能力表现达到全球顶尖水平,本次发布的系列产品,是曙光存储二十年磨一剑的成果。
中科曙光总裁历军在发布会上表示:“新技术新应用快速迭代,而算力和存力是不变的两大底层支撑,先进算力和先进存力也是曙光长期投入研发的重要业务之一。曙光相信,变化是常态,而在任何时代,唯有强者‘恒存’。”
世界级“强存” 硬核技术自研突破
作为全球存储技术皇冠上的明珠,集中式存储性能往往代表存储厂商的最高水准。坚持自主研发二十年的曙光存储,本次发布的FlashNexus系列不仅是全球首个亿级IOPS集中式全闪存储,还是业界唯一有百控级扩展能力的集中式存储产品,稳定性保障首次突破7个9,综合性能领先同类产品50%以上,又一次用前沿技术引领产业革新。
曙光存储“强存”—重磅发布FlashNexus集中式全闪新品
应对金融、运营商、医疗等行业的全部关键业务系统,比如证券报盘等,一套FlashNexus产品即可轻松应对。此外,通过全栈自研软硬件支撑,FlashNexus可为用户提供强安全性与强生态兼容性。
“智存” 五级加速 做最懂AI的存储
在发布会上,曙光存储宣布重磅升级经典分布式存储产品——ParaStor全闪存储。新一代ParaStor依托NVMe全闪的技术优化,单节点带宽最高达到130GB/s,320万IOPS,成为国产化、x86、ARM等平台的最佳选择。
曙光存储“智存”—ParaStor分布式全闪系列全面升级
作为AI存储加速利器,升级后的ParaStor全闪存储具备五级数据加速技术,包括本地内存加速、BurstBuffer加速层、XDS双栈兼容、网络加速与存储节点高速层,搭配全路径AI亲和机制,让数据无需等待。容器化AI平台的最佳存储选择,可极致发挥硬件性能,提升全平台整体表现20倍以上!
跨平台 “通存” 让数据无界流动
当前伴随AI大模型狂飙,算力网络快速发展,不同平台、不同形态数据的融合应用需求持续突显。跨域存储集群组合管理、数据冷热分级感知、数据跨域网流动及跨域无感知访问等关键技术亟待攻克。
曙光存储首创“通存”解决方案,借助同根同源的集中式存储资源池与分布式存储资源池,让数据无界流动,实现跨平台一键式容灾恢复、跨形态热温冷数据无感流动和跨域资源池全维度视图,以充分提升存储资源利用率,并大幅降低整体数据拥有成本。
曙光存储首创“通存“方案
20年来,曙光存储自强不息,在时代召唤下诞生,在产业需求中前行,以“强者恒存”的理念精神,做先进存力先锋探索者。曙光存储也期待赋能更多伙伴取得业务成功,成为时代“强者”。
目前,曙光存储已与运营商、AI、科教、金融、医疗、政府、能源、制造等国家重点领域客户达成深度合作,携手突破业务发展面临的数据存储挑战。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。