5月9日,“东数西算下数据存力发展研讨会”在京成功举办,来自武汉光电国家研究中心、中国计算机行业协会、赛迪顾问、曙光存储的多位专家共话存力发展。会上,华中科技大学武汉光电国家研究中心的吴非教授提出:“‘东数’要想更好实现‘西算’,算力是中心,存储则是根基,海量数据要想算得好,得先存得下,读得快。”数据是算力的基石,算力依赖存力,因此“东数西算”的实质更多地表现为“东数西存”。
参会嘉宾合影
存储缺口扩大,“西算”需先“西存”
东数西算全面落地以来,数据要素充分激活,算力存力的需求激增。据统计,去年底,我国总算力规模达180EFLOPS,存力总规模超过1000EB。“由于数据的价值挖掘以存储为前提,需求巨大,到2025年,我国将有超过420EB的巨大存储缺口亟待补充”赛迪顾问股份有限公司业务总监高丹表示。
面向多元场景,存储将迎全面革新
在谈及东数西算对数据存储底座建设的需求时,中国计算机行业协会信息存储与安全专委会秘书长阳小珊提到:“数据存储首先是安全合规,要降低开源软件依赖,提高存储技术自研能力。”
与此同时,东数西算打通了多元数字业务场景,激发了丰富的应用需求,要实现东西部数据的无障碍无延迟流通,扩大软硬件及应用生态,更需要推动融合、智能的一体化存力布局。
全栈技术能力,驱动存力一体化布局
曙光存储事业部副总经理张新凤表示:“只有实现东西部存力一体化,才能应对东数西算海量丰富的存储新需求”。2009年曙光开始做自主研发,由此开启了分布式存储自研之路。十余年间,曙光存储不断突破创新,建立海量自研分布式存储集群,同时发挥存储全栈技术能力,布局存力一体化,将存储和计算的资源进行整合,实现东数西算存力统筹调度。
在面对未来多元的融合业务场景时,曙光存储支持文件、对象、HDFS、块等多种协议,实现主流云平台、容器的高效无缝对接,支撑丰富的上层应用。同时,曙光存储将智能融入实施规划、运维管理、应用指导的全流程,推动视图化统一管理,提升运维效率,降低人力成本。
更多曙光相关资讯,欢迎搜索微信公众号“中科曙光/sugoncn”,关注曙光公司官方微信。
好文章,需要你的鼓励
随着AI模型参数达到数十亿甚至万亿级别,工程团队面临内存约束和计算负担等共同挑战。新兴技术正在帮助解决这些问题:输入和数据压缩技术可将模型压缩50-60%;稀疏性方法通过关注重要区域节省资源;调整上下文窗口减少系统资源消耗;动态模型和强推理系统通过自学习优化性能;扩散模型通过噪声分析生成新结果;边缘计算将数据处理转移到网络端点设备。这些创新方案为构建更高效的AI架构提供了可行路径。
清华大学团队开发了CAMS智能框架,这是首个将城市知识大模型与智能体技术结合的人类移动模拟系统。该系统仅需用户基本信息就能在真实城市中生成逼真的日常轨迹,通过三个核心模块实现了个体行为模式提取、城市空间知识生成和轨迹优化。实验表明CAMS在多项指标上显著优于现有方法,为城市规划、交通管理等领域提供了强大工具。
Meta以143亿美元投资Scale AI,获得49%股份,这是该公司在AI竞赛中最重要的战略举措。该交易解决了Meta在AI发展中面临的核心挑战:获取高质量训练数据。Scale AI创始人王亚历山大将加入Meta领导新的超级智能研究实验室。此次投资使Meta获得了Scale AI在全球的数据标注服务,包括图像、文本和视频处理能力,同时限制了竞争对手的数据获取渠道。
MIT研究团队发现了一个颠覆性的AI训练方法:那些通常被丢弃的模糊、失真的"垃圾"图片,竟然能够训练出比传统方法更优秀的AI模型。他们开发的Ambient Diffusion Omni框架通过智能识别何时使用何种质量的数据,不仅在ImageNet等权威测试中创造新纪录,还为解决AI发展的数据瓶颈问题开辟了全新道路。