12月23日,存储产业技术创新战略联盟和中国电子技术标准化研究院联合编写的《存储产业标准化白皮书(2022)》正式发布。
《存储产业标准化白皮书(2022)》
本白皮书结合“十四五”规划重要精神、存储产业发展情况及国内存储产业标准化工作现状,提出新一代存储产业标准化体系框架和建议,推动国内存储标准化工作的发展,引导国内存储技术方向,解决存储关键技术问题,推动中国存储标准走向全世界。
存储产业标准体系结构图
存储标准化 为数字经济提供助力的第一要务
以数字经济为核心,建设新型基础设施是国家战略发展的重要举措。习近平总书记指出:发展数字经济是把握新一轮科技革命和产业变革新机遇的战略选择。加快构建全国一体化大数据中心协同创新体系,是贯彻落实党中央、国务院决策部署的具体举措。以深化数据要素市场化配置改革为核心,优化数据中心建设布局,推动算力、算法、数据、应用资源集约化和服务化创新,对于深化政企协同、行业协同、区域协同,全面支撑各行业数字化升级和产业数字化转型具有重要意义。
数据是国家基础战略性资源和重要生产要素,而存储作为数据的载体,是新型基础设施的基础、数据中心构建的基座,也是数字经济发展和数字化转型的基石。存储产业的发展在数字经济和新型基础设施建设中具有举足轻重的地位。数字经济的快速发展带来数实融合以及应用需求的多元化,同时带动存储生态百花齐放。存储各产品、接口、功能、协议等各层各级互联互通需求迫切,产业统一的标准化需求强烈,存储产业标准化逐渐成为促进生态快速健康发展,为数字经济发展提供助力的第一要务。
闪存化、融合化 代表存储产品标准化发展走势
数字化、云计算、智能化所催生的大数据爆炸性增长的态势,改变了存储产品市场的格局。从存储系统维度看,集中式架构和分布式架构两种产品形态长期共存、不断创新。
首先,集中式存储正向全闪架构加速演进。近年来,随着固态硬盘(SSD)高速介质的应用越来越广泛,集中式存储的架构也在渐渐往全闪存储架构的方向演进,并最终会成为主流的方向。据IDC统计,2021年集中式存储占中国企业级存储市场55.6%的份额。集中式存储中的全闪存储因其性能及SSD介质成本不断降低等优势,在2021年增速达到15.9%,市场份额占比高速增长,成为用户关键应用系统的新选择。从长远看,集中式存储在金融、证券等关键市场的高IOPS、低时延、高可靠、高安全等领域会占据主流。
中国集中式存储市场全闪预测
其次,分布式存储架构趋向融合。分布式存储因其支持块、文件、HDFS、对象多种协议的特性,被广泛应用于内容资源池、备份归档、视频存储、云平台存储等多个场景,具有较好的场景适应性。分布式存储作为近几年不断被熟知的存储产品形态,不断被市场认可,凭借良好的扩展性、存储成本等因素,在互联网、人工智能、大数据、云计算等新兴场景中被广泛使用。据IDC统计,2021年分布式存储份额为23.9%,未来5年复合增长率达到12.8%,在2026年市场份额将接近30%,成为中国企业存储市场的重要部分。《存储产业标准化白皮书》建议定义分布式融合存储的通用技术要求,包括不同级别的融合架构,以及功能、接口、性能、可靠性、等技术要求,并且要适用于融合存储产品的设计和实现。目前Dell EMC、浪潮等成为集中式和分布式存储领域的主流厂商。
中国分布式存储市场份额及增长率分析
SSD市场 到2025年规模达到500亿美元
由于NAND闪存介质具有高性能、低延时的特性且Flash颗粒单位成本不断降低,在存储产业闪存化趋势带动下,SSD市场迎来高速发展。据IDC预测,SSD有望突破成本瓶颈,凭借访问速度和存储密度优势,代替机械硬盘成为市场主流存储介质,预计到2025年全球的SSD市场规模将由2020年的300亿美元增长到约为500亿美元。其中企业级SSD的技术开发壁垒相比较高,代表厂商有浪潮、Samsung等 。
全球SSD&HDD出货量分析
未来 存储标准化建设方向
在存储产业蓬勃发展的大背景下,在一切都要标准化运作的大趋势下,存储产业的标准化的发展成为重中之重。存储产业标准化体系建设需加强领域覆盖、更新机制、建立专家资源池、建立标准研究共研机制和信息共享机制,推动存储产业突破产品兼容管理、智能运维、绿色低碳等标准领域核心技术,创新从SSD核心部件到存储系统的全栈产品发展,加快应用落地,完善产业生态,将数据存储打造为加速数字经济发展的核心引擎。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。