当今的世界由数字驱动,离开了数据啥都运行不了。各种流媒体服务、社交媒体平台、电子商务和云计算等等都会产生大幅激增的数据,而且在短期内不会放缓。据最新估计,全球每天产生的数据量达 3.2877 亿 TB(10的12次方字节),预计 至2025 年全球每天产生的数据量将达到 180 ZB(10的21次方字节)。
在数据的上下文里,1 ZB (Zettabyte) 等于 10 亿(10的9次方)个TB (Terabytes )。虽然这些数字非常大,但预计还会继续膨胀。其实这也不足为奇,过去几十年中产生的数据比人类整个历史产生的数据还要多。
然而,这样的指数式增长是有代价的,存储、处理和分发所有这些数据需要数据中心,相关的需求因此也在同步激增。
数据中心需求的增长导致了其他需求的增长。这些数据中心在运行时需要保持冷却,避免其过热、损坏或崩溃,所需的能源需求也随之增长。美国能源部能源高级研究项目局(ARPA-E)因此创建 了 COOLERCHIPS 计划,目标是“为数据中心开发变革性、高效和可靠的冷却技术”。
存储数据要付出各种代价,尤其是在环境足迹方面。其足迹包括能源消耗、用水量甚至硬件的生命周期。David Mytton 和 Masao Ashtine 在对数据中心能源估算进行了全面审视后发现,数据中心的能耗约占全球能耗的 1%-2% 及占美国总用电量的 2%。
而数据中心能耗中很大一部分是用于一项关键功能:冷却数据中心。功能强大的计算机在处理和存储海量数据时会产生大量热量,如果不控制温度就会出现过热现象,进而损坏服务器设备并导致死机。
NeuReality 公司创始人兼首席执行官 Moshe Tanach 在被问及当前数据中心冷却所面临的挑战时告诉记者,“数据中心的冷却能源是计算基础设施功耗和散热产生的副作用。虽然冷却能源是数据中心的关键部分,但要解决的更大问题是热量的源头:即计算基础设施。”
Tanach 表示,数据中心产生的热量越来越多,其中最大的贡献者是 GPU、张量处理单元(TPU)等深度学习加速器(DLA)系统。他补充表示,“在生成式人工智能和大型语言模型(LLM)的部署范围扩大后,情况会变得更糟。”
冷却对数据中心的性能至关重要,这有点像在炎热的夏天人类需要风扇或空调来保持凉爽,否则就会中暑。这些数据中心平均 40% 以上的能耗都用于冷却和通风系统,原因是一样的。无论是机房空调(CRAC)装置、机房空气处理器(CRAH)装置、后门热交换器或是直接膨胀(DX)冷却,冷却系统的成本都不低。
研究公司 Omdia 的云计算和数据中心研究总监 Vladimir Galabov 也认为,数据中心冷却面临的一大挑战是降低冷却服务器的空调和风扇的能耗。他告诉记者,“十几年以来,一些最大的数据中心运营商一直都在尝试更有效地冷却服务器。其中一个实验途径就是机械冷却,就是用风扇。服务器风扇消耗的电力占服务器耗电量的很大一部分。另一条途径是完全取消风扇,只使用液体冷却,或结合使用后门热交换器和直接芯片冷却等冷却技术。”
他补充表示,“我预计,优化那些涉及计算和电源转换的机械部件将是数据中心运营商需要探索的两个关键数据中心效率途径。与其使用功能较弱的处理器,不如提高非关键组件的效率。”
《全球市场洞察》(Global Markets Insight)的一份关于数据中心冷却市场的报告发现,2022 年该市场的规模为 100 亿美元。报告还指出,减少数据中心碳足迹的迫切需要(目前数据中心碳足迹占全球能源相关温室气体排放量的 1%以上,在美国则占 3%)正在推动节能冷却系统的推广。
除能源使用外,发电或冷却数据中心间接和直接消耗的水如果继续不加控制也会带来气候风险。NTT 全球数据中心产品和市场高级副总裁 Bruno Berti对此深有同感,他告诉 记者,传统的数据中心设计使用的“蒸发冷却技术大量浪费水资源”。他补充表示,虽然 Berti 承认这些传统技术“非常高效,有助于为数据中心降温,但从水资源的角度来看,显然是非常浪费",并对气候造成了不利影响。
NTT 全球数据中心已不再采用蒸发冷却技术和工艺,而是采用风冷式冷却器,就是因为这个原因。
Berti 强调提了利用风冷式冷却器等先进冷却解决方案的重要性,这些解决方案可以在降低成本的同时改善数据中心的冷却效果。
这正是 COOLERCHIPS(Cooling Operations Optimized for Leaps in Energy, Reliability, and Carbon Hyperefficiency for Information Processing Systems的缩写,意为“实现信息处理系统的能源、可靠性和碳效率飞跃的优化冷却技术”)计划可以提供帮助的地方。能源高级研究项目局推出 COOLERCHIPS 计划的目的是利用尖端技术和节能策略,减少美国数据中心冷却所需的能源总量,从而彻底改变数据中心的冷却方式。
COOLERCHIPS 计划的的资助资金为 4200 万美元,一些大学、企业和国家实验室的 15 个项目将获得资助,项目将为数据中心开发高性能、高能效的冷却解决方案。获资助的大学和企业包括英伟达(Nvidia)、加利福尼亚大学、惠普(HP)、阿肯色大学、英特尔联邦公司和普渡大学,每个受资助者的资助金额从 120 万美元到 500 万美元不等。
这些项目将涵括二次冷却回路组件、冷却系统软件、模块化/边缘数据中心冷却系统等技术的开发,甚至包括测试新技术的支持设施,所有这些技术的目标都是为了将用于冷却的电力降低到仅占数据中心总能耗的 5%,而目前用于冷却的电力占 33% 至 40%。
电力的减少将降低这些数据中心的运营碳足迹,将有助于环境的可持续发展。
美国能源部长 Jennifer Granholm 表示,“开发高效冷却数据中心解决方案以及减少相关碳排放的解决方案有助于实现应对气候变化和确保未来清洁能源所需的技术突破。”
Galabov则表示,“任何能够提高数据效率的研究和资金都非常受欢迎。”但他补充表示,“COOLERCHIPS 计划能取得多大的成功取决于获资助开发出来的创新成果的吸引力。”
Galabov觉得许多 COOLERCHIPS 项目没有去解决的一个大问题,就是如何找到一个无害且价格合理的液体冷却技术。他表示,“这是一个待开发的领域。是我们所有人都应该关心的事情。”
Galabov 最后表示,由于数据中心用电量巨大,即使是很小的改变也会带来很大的不同。他表示,对于一个每年电费支出达 3 万亿美元的行业来说,即使减少 5% 或 10% 的用电量也会为数据中心节省大量成本并提高效率。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。