中国政府在最新的2025年《政府工作报告》中提出,将持续推进“人工智能+”行动,将数字技术与制造优势、市场优势更好结合起来。随着当前AI技术加速迭代演进,该行动旨在大力推进AI规模化商业化应用,推动AI在经济社会发展各领域加快普及、深度融合。
为了跟上亚太地区瞬息万变的发展趋势,各类组织正全力构建能够支撑AI应用的计算与性能基础设施。随着企业不断扩展AI版图,一个不易察觉且日益突出的挑战常常被忽视:如何高效存储AI所需、所消耗及所产生的海量数据。
Stefan Mandl,西部数据中国、日本及亚太地区销售与市场营销副总裁
大众针对 AI 与数据的讨论主要集中在GPU和闪存性能,却很少提及这些数据从何而来,又最终存放在哪里。从训练数据集和模型检查点,到推理日志与遥测技术,AI应用会生成热(hot data)、温(warm data)、冷(cold data)等不同类型的数据,因而需要根据各自不同的性能与容量需求定制存储解决方案。机械硬盘(HDD) 在AI基础设施中发挥着关键作用,为长期、大容量的数据存储提供坚实支撑,并与高性能、低延迟的固态硬盘(SSD)协同运作。
AI工作负载的现实:并非全是“实时”运算
随着科技巨头在亚洲迅速扩展其AI应用能力,AI在数据生命周期的每一个阶段都会消耗并生成海量数据,使数据存储需求随之激增。这些海量数据往往达到PB(Petabyte)级别,为 AI 模型提供所需的数据智能,助力在关键时刻和大规模场景中快速、精准地做出决策。数据越多,模型表现越佳。整个过程包括数据准备与摄取、模型训练、推理与提示、推理引擎以及新内容生成,使AI高度依赖具备不同特性和功能的存储解决方案。
性能表现固然重要,但容量、弹性、可扩展性等因素同样关键。许多数据是一次写入、后续读取,或在训练与遥测日志等特定阶段呈现写入密集型特征。这些数据通常会因为合规要求、模型再训练、快照保存以及未来审计所需等不同需求,需要长期保存,但并非所有数据都需要高性能的闪存存储。事实上,具前瞻性的AI平台必须将高速存储层与高效益存储层结合配置。
超大规模云端服务供应商高度依赖HDD
高容量、高性价比的HDD解决方案为当今广泛的大数据与数据湖提供了基础,这些数据湖存储着用于训练模型的海量数据集。其来源包括原始数据档案、视频内容、对象存储、系统日志、元数据和备份。因此,每一个AI应用都需要智能、可扩展且具成本效益的容量支撑,而这正是HDD持续发挥优势的领域。
在构建AI应用动态存储环境时,单位TB成本是企业关键考量指标。企业需要优化预算分配,最大化可用资源利用率。大多数AI数据属于温数据或冷数据,因此高容量HDD是实现规模化、低成本存储的理想选择。根据西部数据的研究, HDD 在单位TB成本上相比闪存具备 6 倍优势,特别是在大规模、高容量环境中表现突出。与此同时,HDD架构持续创新,使其能够提供更高的存储成本效益,随着HDD容量增长,总体拥有成本 (TCO) 将进一步下降。
明确的性价比指标是影响存储解决方案选择的关键——核心在于为你的工作负载选择最合适的解决方案。HDD持续在AI数据生命周期的多个工作负载中展现出强劲性能,实现了成本与性能的平衡。与其为冗余性能支付多余费用,各企业组织组织可以通过将存储性能与实际需求对齐,来优化总拥有成本。供应商如西部数据提供了兼备高效能及成本效益的储存解决方案,帮助客户根据不同工作负载需求,打造合适的存储组合。
HDD技术正在不断演进,以更高容量、更优性能和更大价值赋能企业。这包括磁记录系统创新,如能量辅助磁记录 (EAMR) 技术和叠瓦式磁记录 (SMR) 技术;以及机械结构创新,例如氦气封装HDD,让3.5英寸硬盘可容纳多达11个磁碟,从而在存储密度、性能与能源效率方面不断突破。展望未来,随着热辅助磁记录 (HAMR) 的广泛应用,HDD的容量还将迎来更进一步提升。
存储命题不是非此即彼,而是分层共进
AI应用对存储的需求极为广泛,而HDD一直是满足亚太地区长期、大规模存储需求的中坚力量,帮助企业组织以高效、高性价比的方式,满足不断增长的高容量需求。如今的HDD并非“传统技术”,而是数据基础设施中,不断进化的核心引擎,承载当下乃至未来AI工作负载所带来,庞大且持续增长的存储需求。
好文章,需要你的鼓励
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。