当前,生成式AI(AIGC)已经成为AI产业化发展的主战场,随着大模型参数量和数据量的爆发式增长,多源异构数据的传、用、管、存,正在成为制约生成式AI落地的瓶颈之一。为了化解生成式AI的数据存储与管理瓶颈,浪潮信息在“数智未来”AIGC数据应用创新论坛上,正式发布面向生成式AI的存储解决方案,该方案以极致融合、极致性能、极致节能,和热温冷冰四级数据全生命周期管理,助力开启生成式AI新局面,创造智慧时代新机遇。
生成式AI亟待突破多源异构和存储性能瓶颈
生产式AI是人工智能从1.0时代进入2.0时代的重要标志,其具备强大的认知智能,在搜索引擎、艺术创作、影音游戏,以及金融、教育、医疗、工业等领域有着广阔的应用前景。Gartner预测,到2023年将有20%的内容被AIGC所创建;到2025 年人工智能生成数据占比将达到10%。据分析师预测,到2032年,生成式人工智能市场规模将达到2,000亿美元,占据人工智能支出总额的约20%,显著高出当前的5%。换言之,未来十年市场规模可能每两年就会翻一番。
生成式AI主要应用场景涵盖文本生成、语音生成、图片生成、视频生成、代码生成、虚拟人生成等,在每种应用的背后是基于行业上下游对数据进行采集、标注、训练、推理、归档,其特征是数据量大、多元数据类型复杂、服务协议多样、性能要求苛刻、要求服务持续在线。生成式AI对数据存储提出如下挑战:
数据存储产业需要进行全方位的技术升级,通过在多源异构融合、数据高速传输、海量数据管理等方面持续创新,打造专业的生成式AI存储产品与解决方案。
浪潮信息让生成式AI智慧有数
浪潮信息是最早布局大模型的企业之一,打造了算力、算法、数据全栈的解决方案能力。在数据存储领域,浪潮信息准确识别行业痛点、积极布局,经过持续攻关,在融合存储架构、系统性能设计、数据全生命周期管理算法等方面不断突破,打造出生成式AI存储解决方案。
浪潮信息生成式AI存储解决方案基于AS13000融合存储系统,可以支撑AIGC产业上中下游业务应用,并针对不同业务阶段的数据存储需求,提供热温冷冰四级存储,实现数据在各级存储间自动流转。用高性能节点形态来满足数据训练、数据推理两个阶段的高带宽、低延时、高并行读写性能存储需求,用大容量节点形态来满足数据采集、数据准备、数据归档三个阶段的海量多元数据存储需求,方案具备极致融合、极致性能、极致节能三大能力,以及热、温、冷、冰四级数据全生命周期存储管理能力,助力生成式AI突破海量数据存力瓶颈,加速释放数据的价值。
目前,浪潮信息生成式AI存储解决方案已经在全球领先的中文语言大模型“源1.0”中成功落地,面对千亿级参数量和数据量带来的挑战,浪潮信息通过AS13000高吞吐并行存储系统实现了多存储协议互通、数据融合,利用全闪的极致性能,助力“源1.0”大模型实现了16天完成训练的超高效率。国内AI独角兽公司采用浪潮信息提供的并行文件存储,承载5000亿参数量的NLP语言类大模型的数据集Token和CheckPoint文件,轻松应对大/小文件的读写挑战,配置AS13000全闪存储集群,支持高性能RocE组网和GPU直通存储功能,带宽超过300GB、存储性能超过350万 IOPS,保证存储集群的高可用与敏捷扩容。
面对生成式AI掀起的变革热潮,谁能掌握数字化变革的先机,谁就能把握未来AI革命的致胜关键,而数据底座将成为千行百业创新变革的重要基石。浪潮信息存储秉承“存储即平台”的产品理念,精耕数据存储产品与解决方案,携手合作伙伴,助力生成式AI在金融虚拟客服、图片编辑设计、智能驾驶、跨模态检索等场景的落地,激活数据要素新潜能,驾驭智慧化转型新趋势,在机遇与挑战并存的新格局下,为行业转型注入新价值、新动能。
好文章,需要你的鼓励
Meta宣布为Facebook Dating推出AI聊天机器人助手,帮助用户找到更匹配的对象。该AI可根据用户需求推荐特定类型的匹配者,并协助优化个人资料。同时推出Meet Cute功能,每周提供算法选择的"惊喜匹配"。尽管18-29岁用户匹配数同比增长10%,但相比Tinder的5000万日活用户仍有差距。AI功能已成为约会应用标配,Match Group等竞争对手也在大力投资AI技术。
字节跳动团队提出RewardDance框架,首次系统性解决视觉生成中的奖励模型扩展问题。该框架通过将奖励预测转为生成式任务,并将模型规模扩展至260亿参数,同时集成任务指令、参考样例和推理能力,有效解决了"奖励作弊"问题。实验显示,在文本生成图像任务中质量提升10.7分,视频生成性能改善49%,达到行业领先水平,为AI视觉创作提供了更强大可靠的技术基础。
Neo4j认为已找到让生成式AI访问图数据库记录的方法。图数据库专注于数据点之间的关系建模和查询,在欺诈检测、推荐引擎等场景中表现出色。2024年4月,ISO批准了图查询语言GQL标准,Neo4j的Cypher查询语言完全符合该标准。现代工具提供拖拽式工作流程,GenAI可作为自然语言接口,将用户请求转换为Cypher查询。
ByteDance团队开发的Mini-o3系统通过深度多轮推理突破了传统AI视觉理解的局限。该系统能像人类侦探般进行几十轮的视觉探索,在困难的视觉搜索任务上准确率达48%,相比现有模型提升显著。核心创新包括挑战性的Visual Probe数据集、多样化推理策略训练和突破性的过轮掩码技术,实现了测试时思考轮数的自然扩展。