作者:Pure Storage 大中华区技术总监 何与晖 Andrew Ho
2011 年,当 Pure Storage 为任务关键型数据中心发表了第一套足够强大、且经济的全闪存存储阵列时,引起了市场与客户的关注。从此,Pure 便立志要实现全闪存数据中心的梦想。
相较于传统的存储介质,如磁盘或磁带,闪存的优势毋庸置疑,但其最大障碍在于成本。不过,磁盘与闪存之间的总体拥有成本 (TCO) 差异,其实比许多人想象的还低。本文将探讨,在未来短期之内可能让硬盘不再具备成本优势的一些因素。
值得事先一提的是,对于任何性能或延迟敏感的工作负载来说,闪存早已是它们的最佳选择。自从闪存进入企业存储市场以来,其便从上至下一级一级地逐步淘汰硬盘,目前只剩下磁盘驱动器还维持着市场占有率优势,即容量导向的近线驱动器。
尽管这是在线数据存储最低的一层,但大部分的数据仍存储在这层,而且在每年出货的硬盘容量中占比越来越大 (超过 70%),这就是闪存接下来要渗透的一层。
NAND 闪存的每比特价格正在以比近线硬盘更快的速度下滑。再加上闪存在电力、空间、制冷方面的优势,以及更高的性能与可靠性,硬盘很快就会变成一种不太具备成本效益的选择。下面就来深入探讨其中的一些因素。
介质成本
第一个最直接的成本就是介质成本。虽然,如今硬盘的每比特成本仍旧低于最高密度的闪存,但 2023 年有几个值得观察的重要趋势。
首先,所有的一线闪存制造商今年都在密度上实现大幅增长,有的甚至做出了 200 层以上的 3D NAND。这种密度增长将转化成更好的成本效率,进一步节省电力和空间。其次,如果分析师的预测准确,NAND 的整体价格将延续 2022 年底开始的趋势,在 2023 年的大部分时间内呈现下跌的走势。
能源成本
如今,数据中心基础架构的能源消耗占了全球的 1% 以上,而且比例还在升高。随着能源成本的持续上涨,信息技术的能源消耗已不再只是一项环保议题,更是一项重大的经济议题。
从总体拥有成本来看,能源消耗在 2023 年及未来甚至将扮演更重大的角色。因此,具备较高电源效率的基础架构将比友商拥有更大的经济优势。随着闪存的密度不断攀升,其未来的电源效率将超越硬盘,达到更低的实质成本。
2022 年,Pure Storage 发布了第一份环境、社会和治理 (ESG) 报告,比较了我们与友商的全闪存系统,并指出我们的系统所消耗的能源比友商少 84%。未来,优良的能源效率将成为 Pure Storage 产品在 TCO 上击败磁盘的主要因素。
更高的性能
在两个关键方面,闪存相对于磁盘的性能优势可以转化为成本优势。
首先,由于磁盘目前的性能依然很低,所以即使在性能需求最轻的工作负载上,您最后还是会有许多闲置的容量。举例来说,或许机械硬盘本身具备 20TB 的存储容量,但如果系统的性能在 16TB 的时候就已经达到极限,那您就无法发挥每比特应有的成本效益。闪存就没有这方面的问题,因为即使容量快要用尽,其读取性能依然稳定,不像硬盘。
其次,任何强调弹性的存储环境都会有冗余策略,例如:存储多个数据复本,以及预留一些备用容量以备不时之需。
这意味着装置的性能将左右您建立的系统具备多少冗余能力。早在多年以前,硬盘的容量就已经大到当一个驱动器发生故障时,您将因为重建时间过长而必须采取双校验位 (dual paity) 冗余策略来确保业务的弹性。如今还可能需要用到三校验位 (triple parity),甚至更多。
但如果采用闪存装置,重建的时间就能缩短,因此只需更少的容量来实现弹性冗余架构,相当于拥有更好的有效成本效率。此外,有些闪存供应商 (例如 Pure Storage) 还提供了强大的自动化弹性调校功能,能将所有的因素都纳入考虑,让用户不必操心他们需要设置什么 RAID 等级。
更好的可靠性
根据 Pure 的数据,我们的系统年化故障率 (AFR) 比任何针对机械磁盘的产业评测结果都低上许多,甚至比 SSD 的业界平均值还低。而更好的可靠性,意味着更好的弹性。
除此之外,也意味着装置需要更换的情况更少,进而降低成本。虽然大多数签订支持合约的客户都不会直接感受到这项成本,但可靠性不足所衍生的成本势必会反映在支持合约当中。这正是为何传统的存储供应商的支持成本在 4、5 年或更久之后将突然暴增。
Pure 的可靠性意味着客户不需每 4、5 年就经历一次砍掉重练的痛苦。那些 6 年前随 Evergreen 订阅方案采购的 Pure Storage 阵列,至今仍有 97% 还在服役,而且还能跟上当今的技术。
闪存就是比较好
一个简单的事实就是:今天已经没有人是因为机械硬盘比较好所以才购买,而是因为比较便宜。闪存几乎在每一方面都优于机械硬盘存储,而且在闪存原本就具备优势的地方,其优势还在持续扩大。目前闪存仍输给磁盘的只有成本,但磁盘与闪存交叉的日子已越来越近。对大多数企业而言,全闪存数据中心的梦想很快就会实现。
好文章,需要你的鼓励
人工智能领域正在通过改进模型工作方式来释放新功能。研究人员开发了一种名为"SVDquant"的4位量化系统,可以使扩散模型运行速度提高3倍,同时提升图像质量和兼容性。这种技术通过压缩参数和激活值来大幅降低内存和处理需求,为资源受限的系统带来新的可能性。
Meta公司开发了一种机器学习模型SEAMLESSM4T,能够实现36种语言之间的近即时语音翻译。该模型采用创新方法,利用互联网音频片段避免了繁琐的数据标注。这一突破性技术有望简化多语言交流,但仍需解决噪音环境、口音等挑战,并关注技术可能带来的偏见问题。
生物制药行业正积极拥抱人工智能技术,大型企业投入巨资,小型公司谨慎布局。行业面临人才、数据和工作流程等挑战,但预计到2025年将在AI就绪度方面取得实质性进展。AI有望加速药物研发,提高效率,最终造福患者,重塑医疗保健的未来。
随着 AI 需求激增,数据中心行业面临严峻挑战。能源消耗激增威胁可持续发展目标,新项目遭遇公众反对。电力供应和分配方式亟需改革,行业或将迎来动荡的 2025 年。