随着十四五规划的落地、“东数西算”工程正式全面启动,推动数字化转型向纵深迈进。如何有效地管理海量多样的数据类型,实现资源共享,进一步发掘数据价值,高效支撑多样化应用,成为存储系统亟待解决的问题。3月23日,曙光就以上问题在京举行技术研讨,与行业资深专家共探存储新发展。
分布式统一存储
应对海量数据多样化应用需求
“面对海量爆发的数据,传统集中式存储已经不是最优选了,现在更多是采用分布式存储解决这个难题。”在海量数据多样化应用需求面前,中科曙光存储事业部副总经理张新凤给出了解决方案。
据悉,相较于传统存储,横向扩展的分布式存储具备扩展性强、容量大、数据安全性高等特点,可轻松应对海量数据的管理需求。而近10年来,曙光一直致力于海量数据存储与处理技术的研发,面对数字化转型的挑战,曙光分布式统一存储系统ParaStor,可应对“5G+AI+云”时代下的海量数据多样化应用需求。
曙光ParaStor集结多项优势
激发数据潜在价值
张新凤介绍,去年底,曙光ParaStor融合了文件、对象、块、HDFS多种协议,真正实现了海量异构数据资源的融合,高效助力企业的数字化转型,可广泛应用于高端计算、通信、自动驾驶、EDA、能源勘探等多个领域,全面挖掘数据的潜在价值。
曙光ParaStor单一存储节点同时支持文件、块、对象、HDFS四种存储服务,3节点存储集群即可承载非结构化与结构化数据业务,消除存储设备多样性及管理复杂性,降低存储系统的构建成本;为了满足对象应用,曙光ParaStor对IO协议栈进行极简优化,实现了单桶千亿KB级小对象的存储能力,存储集群百万级TPS吞吐性能可达到业内领先水平;同时,曙光ParaStor提供原生HDFS接口,无任何协议损耗,无缝接入大数据平台,实现存储与计算资源按需配置的同时,满足新老存储同时读写,应用“0”改造,数据“0”迁移,构建更佳的高性价比大数据存算分离解决方案。
值得一提的是,基于自研优势,曙光可根据不同行业用户的不同需求,进行代码级的定制化设计与开发,产品功能和性能指标可大大优于同类产品。同时,多年来超大规模项目的部署经验与应用的支持,让曙光ParaStor的可靠性和稳定性得到了充分的市场检验。
“存储市场是需要很深技术积累和很大资金投入的市场,所以很早预估到行业的发展趋势,进行自主研发产品的企业一定会跟未来的趋势高度结合”赛迪顾问业务总监高丹表示。作为国内第一批做自研分布式存储的厂商,曙光将不断进行自我革新,根据市场趋势进行产品和系统的迭代升级,开发更多场景应用,切实推进企业的数字化转型。
曙光技术圆桌派精彩回顾:https://live.vhall.com/v3/lives/watch/556380469
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。