从云数据中心到云+智算中心,未来数据中心如何发展?
华为数据中心能源领域总裁尧权表示,未来5年全球AI算力年复合增长率超80%,数据中心将向云+智算中心演进。
“AI大模型时代,未来5年全球AI算力年复合增长率超过80%,数据中心逐步从云数据中心向云+智算中心演进。”华为数据中心能源领域总裁尧权日前作出如上表示。高效、安全、低碳是未来的数据中心应该有的样子,产业如何掌握发展大势中的机遇?
据Uptime数据,从2019年到2022年,数据中心业务中断损失超过10万美元的比例,已经从39%上升至71%,且会随着算力需求翻番成倍增长。毫无疑问,安全可靠是数据中心最核心需求,应具有最高优先级。
为确保数据中心的安全可靠运行,在产品设计、生产环节就要贯穿“全链安全”的理念,同时严控产线质量,高度自动化,减少人为干预,保障产品的高可靠性。传统大型数据中心多采用集中式制冷架构的方案,如传统冷冻水系统,冷冻站涉及七大子系统和几十种设备,一旦发生单点故障,可能会影响整个冷冻站的安全运行。相较之下,分布式制冷架构灵活,各个子系统相互独立,单台设备故障不会影响其他设备运行,故障域更小,可靠性更高,可以直接从架构设计上避免数据中心制冷系统的单点故障,提升数据中心的运行可靠性。
数据中心的维护往往是“事后型”,但随着智算时代的到来,数据中心的故障响应时间大幅缩短。未来数据中心基础设施的运维,预测性维护将成为标配,从“事后型”转为“事前型”。得益于AI技术的快速发展,预测性维护的范围将持续扩大,从电容、风扇等易损件的寿命预测、设备的热失控预警到制冷系统的漏液预警,都能提前预测,提前处理避免事故的发生,做到“治未病”,从被动“救火”走向主动“防火”。
随着数字化、智能化程度的加深,网络安全风险也在成倍增加,网络攻击越来越常态化。不管是UPS还是空调设备,一旦遭遇恶意攻击,都会直接影响数据中心的安全。未来,数据中心基础设施,硬件安全加软件安全,才是全方位的安全,软件安全要从供应安全、纵深防御和运维/运营安全三个维度,构筑全生命周期网络安全防护体系。

高质量交付与高效运营并重
互联网云厂商全球业务加速发展,带动数据中心建设需求显著增长。而传统的数据中心建设模式,建设速度慢、工程复杂,不能满足快速部署的要求。因此,建设周期更短、质量更高的预制化、模块化方案将成为首选。通过“工程产品化”和“产品模块化”,在工厂一体化集成,完成预制和预调试,保证现场交付的是高质量产品,有效缩短交付周期,同时满足客户业务快速上线需求,还大幅减少现场施工造成的“三废”垃圾。
从千柜级建筑到万柜级园区,数据中心呈现规模化、集约化发展趋势,相应的整体运维复杂度也大幅提升,且数据中心设备多为“哑”设备,依赖传统巡检难度大,对技能的要求较高,故障定位时间长。构建专业化的管理平台,可以显著提升数据中心运维效率和准确性,通过原厂的专业化管理平台,帮助客户构建设备深度管理能力,大大降低运维难度,做到快速判断问题,及时排除故障。
当前正处于通用算力到智能算力的过渡期,同一个数据中心会同时存在通用算力和智能算力场景。通用服务器单柜功率密度一般不超过15kW,风冷型设备即可满足制冷需求,而智算中心单柜功率密度通常超过30kW,这种场景往往需要液冷来散热。对于需求不确定的业务场景,风液融合将成为适配未来的数据中心优选架构,通过风冷+液冷可调比例的组合,灵活适应业务需求变化,保护用户投资。
当前,风冷方案在应用当中仍占主流,在冷源侧,间接蒸发冷却方案相较冷冻水系统,在架构、效率和运维方面存在明显优势,是现在和未来最经济适用的制冷方案。间接蒸发冷却的分布式制冷架构可有效避免单点故障,可靠性更高,并且通过最大化利用自然冷源以及一次热交换,就能在寒冷地区绝大部分时间实现无需压缩机制冷。同时,针对智能算力需求,间接蒸发冷却还可以支持未来演进的架构,进一步适配液冷的计算场景。
此外,数据中心能效的提升要转换思路,从关注部件效率转为系统工程优化,用系统工程思维的视角综合审视,在现实条件和部件技术水平之间进行权衡,得出最优解,如UPS双变换模式转向S-ECO、数据中心PUE转向PFPUE(算力PUE),端到端地进行数据中心能效优化。
在数据中心节能方面,除了新建的数据中心,仍有大量存量数据中心PUE远高于“一体化大数据中心”政策要求,面临节能改造的迫切需求。传统的节能改造需要停线停业务,存在业务中断的风险,而采用人工调整优化的方式,难度大、效果差。相较之下,AI能效调优解决方案通过预置AI算法和大数据模型,可对存量数据中心实现节能优化,且AI调优不依赖人工经验,优化速度快,效果好。
0赞好文章,需要你的鼓励
推荐文章
OpenAI 本周为 ChatGPT 添加了 AI 图像生成功能,用户可直接在对话中创建图像。由于使用量激增,CEO Sam Altman 表示公司的 GPU "正在融化",不得不临时限制使用频率。新功能支持工作相关图像创建,如信息图表等,但在图像编辑精确度等方面仍存在限制。值得注意的是,大量用户正在使用该功能创作吉卜力动画风格的图像。
Synopsys 近期推出了一系列基于 AMD 最新芯片的硬件辅助验证和虚拟原型设计工具,包括 HAPS-200 原型系统和 ZeBu-200 仿真系统,以及面向 Arm 硬件的 Virtualizer 原生执行套件。这些创新工具显著提升了芯片设计和软件开发的效率,有助于加快产品上市速度,满足当前 AI 时代下快速迭代的需求。
人工智能正在深刻改变企业客户关系管理 (CRM) 的方方面面。从销售自动化、营销内容生成到客服智能化,AI不仅提升了运营效率,还带来了全新的服务模式。特别是自主代理AI (Agentic AI) 的出现,有望在多渠道无缝接管客户服务职能,开创CRM发展新纪元。
数据孤岛长期困扰着组织,影响着人工智能的可靠性。它们导致信息分散、模型训练不完整、洞察力不一致。解决方案包括实施强大的数据治理、促进跨部门协作、采用现代数据集成技术等。克服数据孤岛对于充分发挥AI潜力至关重要。