从云数据中心到云+智算中心,未来数据中心如何发展?
华为数据中心能源领域总裁尧权表示,未来5年全球AI算力年复合增长率超80%,数据中心将向云+智算中心演进。
“AI大模型时代,未来5年全球AI算力年复合增长率超过80%,数据中心逐步从云数据中心向云+智算中心演进。”华为数据中心能源领域总裁尧权日前作出如上表示。高效、安全、低碳是未来的数据中心应该有的样子,产业如何掌握发展大势中的机遇?
据Uptime数据,从2019年到2022年,数据中心业务中断损失超过10万美元的比例,已经从39%上升至71%,且会随着算力需求翻番成倍增长。毫无疑问,安全可靠是数据中心最核心需求,应具有最高优先级。
为确保数据中心的安全可靠运行,在产品设计、生产环节就要贯穿“全链安全”的理念,同时严控产线质量,高度自动化,减少人为干预,保障产品的高可靠性。传统大型数据中心多采用集中式制冷架构的方案,如传统冷冻水系统,冷冻站涉及七大子系统和几十种设备,一旦发生单点故障,可能会影响整个冷冻站的安全运行。相较之下,分布式制冷架构灵活,各个子系统相互独立,单台设备故障不会影响其他设备运行,故障域更小,可靠性更高,可以直接从架构设计上避免数据中心制冷系统的单点故障,提升数据中心的运行可靠性。
数据中心的维护往往是“事后型”,但随着智算时代的到来,数据中心的故障响应时间大幅缩短。未来数据中心基础设施的运维,预测性维护将成为标配,从“事后型”转为“事前型”。得益于AI技术的快速发展,预测性维护的范围将持续扩大,从电容、风扇等易损件的寿命预测、设备的热失控预警到制冷系统的漏液预警,都能提前预测,提前处理避免事故的发生,做到“治未病”,从被动“救火”走向主动“防火”。
随着数字化、智能化程度的加深,网络安全风险也在成倍增加,网络攻击越来越常态化。不管是UPS还是空调设备,一旦遭遇恶意攻击,都会直接影响数据中心的安全。未来,数据中心基础设施,硬件安全加软件安全,才是全方位的安全,软件安全要从供应安全、纵深防御和运维/运营安全三个维度,构筑全生命周期网络安全防护体系。

高质量交付与高效运营并重
互联网云厂商全球业务加速发展,带动数据中心建设需求显著增长。而传统的数据中心建设模式,建设速度慢、工程复杂,不能满足快速部署的要求。因此,建设周期更短、质量更高的预制化、模块化方案将成为首选。通过“工程产品化”和“产品模块化”,在工厂一体化集成,完成预制和预调试,保证现场交付的是高质量产品,有效缩短交付周期,同时满足客户业务快速上线需求,还大幅减少现场施工造成的“三废”垃圾。
从千柜级建筑到万柜级园区,数据中心呈现规模化、集约化发展趋势,相应的整体运维复杂度也大幅提升,且数据中心设备多为“哑”设备,依赖传统巡检难度大,对技能的要求较高,故障定位时间长。构建专业化的管理平台,可以显著提升数据中心运维效率和准确性,通过原厂的专业化管理平台,帮助客户构建设备深度管理能力,大大降低运维难度,做到快速判断问题,及时排除故障。
当前正处于通用算力到智能算力的过渡期,同一个数据中心会同时存在通用算力和智能算力场景。通用服务器单柜功率密度一般不超过15kW,风冷型设备即可满足制冷需求,而智算中心单柜功率密度通常超过30kW,这种场景往往需要液冷来散热。对于需求不确定的业务场景,风液融合将成为适配未来的数据中心优选架构,通过风冷+液冷可调比例的组合,灵活适应业务需求变化,保护用户投资。
当前,风冷方案在应用当中仍占主流,在冷源侧,间接蒸发冷却方案相较冷冻水系统,在架构、效率和运维方面存在明显优势,是现在和未来最经济适用的制冷方案。间接蒸发冷却的分布式制冷架构可有效避免单点故障,可靠性更高,并且通过最大化利用自然冷源以及一次热交换,就能在寒冷地区绝大部分时间实现无需压缩机制冷。同时,针对智能算力需求,间接蒸发冷却还可以支持未来演进的架构,进一步适配液冷的计算场景。
此外,数据中心能效的提升要转换思路,从关注部件效率转为系统工程优化,用系统工程思维的视角综合审视,在现实条件和部件技术水平之间进行权衡,得出最优解,如UPS双变换模式转向S-ECO、数据中心PUE转向PFPUE(算力PUE),端到端地进行数据中心能效优化。
在数据中心节能方面,除了新建的数据中心,仍有大量存量数据中心PUE远高于“一体化大数据中心”政策要求,面临节能改造的迫切需求。传统的节能改造需要停线停业务,存在业务中断的风险,而采用人工调整优化的方式,难度大、效果差。相较之下,AI能效调优解决方案通过预置AI算法和大数据模型,可对存量数据中心实现节能优化,且AI调优不依赖人工经验,优化速度快,效果好。
0赞好文章,需要你的鼓励
推荐文章
在他看来,企业对AI的恐惧源自未知,而破解未知的钥匙,就藏在“AI平台+开源”这个看似简单的公式里。
斯坦福和魁北克研究团队首创"超新星事件数据集",通过让AI分析历史事件和科学发现来测试其"性格"。研究发现不同AI模型确实表现出独特而稳定的思维偏好:有些注重成就结果,有些关注情感关系,有些偏向综合分析。这项突破性研究为AI评估开辟了新方向,对改善人机协作和AI工具选择具有重要意义。
Pure Storage发布企业数据云(EDC),整合其现有产品组合,提供增强的数据存储可见性和基于策略的简化管理。EDC集成了Purity存储操作系统、Fusion资源管理、Pure1舰队管理和Evergreen消费模式等架构元素,提供类云存储管理环境。该方案支持声明式策略驱动管理,让客户专注业务成果而非基础设施管理。同时发布高性能闪存阵列和300TB直接闪存模块,并与Rubrik合作提供网络安全防护能力。
威斯康星大学研究团队提出"生成-筛选-排序"策略,通过结合快速筛选器和智能奖励模型,在AI代码验证中实现了11.65倍速度提升,准确率仅下降8.33%。该方法先用弱验证器移除明显错误代码,再用神经网络模型精确排序,有效解决了传统方法在速度与准确性之间的两难选择,为实用化AI编程助手铺平了道路。