当前,AIGC技术的爆发,让产业智能化和智能产业化进入高速发展期,数据作为关键生产要素,正在成为这轮全球增长和科技创新的引擎。近日,浪潮参加由百易传媒举办的2023全球闪存峰会,并在会上重磅发布高性能分布式存储平台AS15000G7,以在性能、管理、融合和效率方面追求极致的智慧存储新品,构筑智慧世界基石,推进AI产业化变革。
AI大模型对数据存储产业带来的机遇与挑战
AIGC是当前通用人工智能产业发展创新的核心技术,其具备强大的认知智能,在搜索引擎、艺术创作、影音游戏,以及金融、教育、医疗、工业等领域有着广阔的应用前景。Gartner预测,到2023年将有20%的内容被AIGC所创建;到2025 年人工智能生成数据占比将达到10%。据分析师预测,到2032年,生成式AI市场规模将达到2,000亿美元,占据人工智能支出总额的约20%,明显高出当前的5%。换言之,未来十年市场规模可能每两年就会翻一番。
AIGC的爆发,源自于大模型的逐渐成熟,大模型成熟的先决条件是大规模高质量的数据、强大的算力和成熟优化的算法,而其中,数据质量和数量决定了算法的效果和性能。随着参数量和数据量的极速膨胀,数据存储与管理正在成为制约AIGC产业发展的瓶颈:一是要支撑基于海量多元异构数据的归集、标注、训练、推理和归档全生命周期管理;二是要承载AIGC数据训练推理时的高性能、低延时、大容量、易扩展、自由流动的严苛需求。大模型训练数据多元、数据作业流程长、多态大模型数据量持续增长、多模计算大模型性能要求高,对当前AI数据存储基础设施提出了新挑战:
浪潮高性能分布式存储平台AS15000G7
产业发展的根本在于科技创新。浪潮作为最早布局AI产业的企业之一,围绕智算中心业务布局,打造了算力、算法、数据全栈解决方案。在数据存储领域,浪潮秉承“存储即平台”的产品理念,准确识别客户痛点积极布局面向AIGC应用场景的数据全生命周期存储解决方案,并基于业界对大模型训练的数据存储在性能、管理、融合和效率方面更极致的需求,重磅发布高性能分布式存储AS15000G7平台,助力AIGC在金融、教育、医疗等领域突破海量多元异构数据存力瓶颈,加速释放数据价值。

极致性能,加速AI大模型训练。AS15000G7采用高吞吐并行存储系统,通过GDS、RDMA技术缩短I/O路径;通过智能元数据管理,提前缓存用户数据和文件系统元数据,显著提升数据访问和检索速度;独有的智能网络优化技术,可实现多个子网与指定目的地通信,每对守护进程之间建立多个TCP连接并通信,显著提升网络端口并发能力,实现传输端口带宽翻数倍,时延缩短50%以上,小文件级传输的时延可降至毫秒级。
极致管理,AI训练全流程透明可控。AS15000G7新品可同时搭载AIStation调度平台和InView数据管理平台,对AI服务器、网络、存储智能运维。支持训练推理全流程的多租户管理、资源分配、数据管理分析;支持本地和云端的系统性能监控,其中云端监控支持多数据中心统一界面管理,自动预警功能可帮助本地运维人员早发现问题早处理, HDD/SSD寿命和故障预测功能在14天内的准确率高于95%,处于业界领先水平,可帮助客户提前做好设备更新迭代规划,保证数据的可靠性和可用性;同时支持纳管多品牌存储系统,实现IT设备高利用率。总得来说,一套存储平台可以实现对AIGC数据采集、清洗、训练、推理、归档不同场景全流程的设备资源监控和管理,助力客户更加专注于大模型训练本身。
极致融合,海纳多源异构巨量数据。AS15000G7平台基于其融合架构,支持文本、图片、音频、视频等多种类型数据存储,可对文件、对象、大数据以及视频的存储方式进行并行访问,支持多协议实时互访互通和系统扁平扩展。而且数据访问过程中保持语义一致、性能无损,从而对AI大模型海量多源异构非结构化数据实现高效共享。
极致效率,提升用户IT设备投资回报比。AS15000G7平台基于自动化的数据分层和迁移,在确保对应用安全透明的前提下,可实现热温冷冰数据全生命周期的管理,通过基于闪存、磁盘、磁带、光盘的性能型、均衡型、容量型三种机型的按需灵活配置,存储TB级数据成本可降低超50%,TCO降低35%。
“当前,各个厂商纷纷投资IT基础设施,训练自己的大模型,国内已发布的AI模型超过了100个,’百模争秀’的格局初现,云厂商和运营商对IT硬件的投资往往是数千甚至上万节点规模,而行业型大厂投资在几百节点规模,在建设布局时考虑到AI大模型对高性能AI服务器、高吞吐并行存储系统、低延迟RDMA网络的严苛需求,将数据中心的计算、全闪存储、混闪存储按照1:1:1黄金比例建设,用户可最大化获得投资回报比。”浪潮信息存储产品线副总经理刘希猛表示。
得益于前瞻布局和技术创新,浪潮高性能分布式存储AS15000G7平台,已在“源”大模型中部署,并在智能客服、生物识别、互联网金融、精准营销等云数智新场景广泛应用。面对生成式AI掀起的变革浪潮,浪潮将秉承“存储即平台”的产品理念,不断精耕数据存储产品和解决方案,以极致性能、极致管理、极致融合、极致效率的数据存储基础设施,让数据存力像水电一样赋能千行百业,服务大众,成为人人可见、普适易用、高效互联的基础设施,革命性地提升人类生产生活水平。
好文章,需要你的鼓励
西部数据闪存业务分拆后,SanDisk宣布将停用广受欢迎的WD Black和Blue品牌,推出全新的SanDisk Optimus系列NVMe产品线。WD Blue驱动器将更名为SanDisk Optimus,而高端WD Black驱动器将分别更名为Optimus GX和GX Pro。尽管品牌变更,底层硬件和供应链保持不变。然而受全球内存短缺影响,预计2026年第一季度客户端SSD价格可能上涨超过40%。
上海AI实验室开发RePro训练方法,通过将AI推理过程类比为优化问题,教会AI避免过度思考。该方法通过评估推理步骤的进步幅度和稳定性,显著提升了模型在数学、科学和编程任务上的表现,准确率提升5-6个百分点,同时大幅减少无效推理,为高效AI系统发展提供新思路。
福特汽车在2026年消费电子展上宣布将在车辆中引入AI助手技术。该AI助手最初将在福特和林肯智能手机应用中推出,从2027年开始成为新车型的原生功能。福特希望通过AI技术实现车辆个性化体验,提供基于位置、行为和车辆能力的智能服务。同时,福特将采用软件定义车辆架构,推出自研的高性能计算中心,提升信息娱乐、驾驶辅助等功能。
MIT团队开发的VLASH技术首次解决了机器人动作断续、反应迟缓的根本问题。通过"未来状态感知"让机器人边执行边思考,实现了最高2.03倍的速度提升和17.4倍的反应延迟改善,成功展示了机器人打乒乓球等高难度任务,为机器人在动态环境中的应用开辟了新可能性。