在数据中心电力需求快速增长的时代,数据中心运营商面临着优化能源使用的巨大压力。
好消息是,许多有效的电源优化策略可以帮助更高效地消耗能源。坏消息是,面对如此多的可行选择,根据特定数据中心的IT需求和预算来确定最佳电源优化技术可能很困难。
为了提供指导,这里介绍了优化数据中心电力使用的五种方法。从最简单且在许多情况下成本最低的措施开始,然后转向更复杂的策略,虽然这些策略可能产生更大的影响,但成本也往往更高。
热通道和冷通道
减少数据中心能源浪费的最简单方法之一是通过在服务器机房采用热通道/冷通道布局来提高气流效率。这种策略涉及将服务器背靠背放置。由于大多数服务器使用风扇向后端散热,这种布置将热量集中在服务器机房内的"热通道"中。
从那里,可以比冷却系统必须针对整个机房而不是专注于热通道更有效地散热。
热通道/冷通道布局对数据中心来说成本为零,因为它们不需要额外的设备或消耗更多空间。尽管如此,它们可以将能源效率提高多达35%。
服务器整合
一般来说,服务器数量越少,能耗越低。即使服务器集合的总计算能力保持不变,这也是正确的:一台容量是两台能力较弱服务器两倍的强大服务器,其耗电量会少于这两台服务器单独运行时的耗电量。
服务器整合可以帮助优化数据中心的电力消耗。通过将工作负载从利用率不足的服务器迁移到其他服务器,数据中心可以在托管更少服务器的同时支持相同总数的工作负载。
服务器整合成本很低,因为它不需要购买新硬件,尽管可能存在与迁移工作负载所需的员工时间相关的成本。企业只需更有效地利用他们已经拥有的服务器。实际上,整合服务器甚至可能产生收入,如果它允许组织转售不再需要的服务器。
监控电力使用
对数据中心电力使用情况了解得越多,就越容易优化电力效率。
为此,电力监控和计量工具可以帮助数据中心运营商识别耗电量超过正常水平的服务器,然后采取措施提高这些服务器的效率。作为额外的好处,电力监控可以提供对数据中心电力基础设施可靠性的洞察,并帮助识别风险,例如接近过载的电路。
部署电力监控和计量解决方案需要成本,但成本并不特别高。数据中心基础设施管理工具通常包括使用软件跟踪电力使用的电力监控功能,硬件设备(比基于软件的监控更准确和精细)的价格只是典型数据中心年度能源费用的一小部分。
直接芯片冷却
冷却系统通常是数据中心中最耗能的组件之一。这就是为什么投资更高效的冷却技术,如直接芯片冷却,可以帮助优化电力使用。
直接芯片冷却涉及将冷却剂与产生最多热量的IT设备部件直接接触。该系统实现效率是因为它可以直接在源头针对热量,而不必冷却大的环境区域。
直接芯片冷却的缺点是价格不便宜,每个服务器机架的成本约为5000美元起。也就是说,该系统可以通过减少能源费用在长期内节省大量资金。
浸没式冷却
对于致力于将电力效率优化推向极致的数据中心运营商来说,浸没式冷却是一个合理的选择。浸没式冷却系统将服务器浸没在非导电液体中,这是比直接芯片冷却更有效的散热方式。
然而,浸没式冷却也比直接芯片冷却更昂贵。一项研究发现,安装浸没式冷却的每机架成本约为26500美元。但同样,长期的电力节省可以证明初始投资的合理性。
让电源优化为您的数据中心发挥作用
上述电源优化策略为数据中心运营商提供了从快速见效到变革性投资的清晰路线图。从热通道/冷通道配置和服务器整合等零成本解决方案开始,允许组织实现即时能源节省,同时为更大规模的举措建立动力。
成功的电源优化关键在于采取与预算和运营要求相一致的分阶段方法。从更简单的策略开始建立基线改进,然后随着能源节省证明成本合理性,逐步投资于直接芯片或浸没式冷却等更复杂的解决方案。通过结合多种电源优化技术,数据中心可以在保持峰值性能和可靠性的同时实现能耗的大幅降低。
Q&A
Q1:热通道和冷通道布局是什么?效果如何?
A:热通道/冷通道布局是将服务器背靠背放置的策略,将热量集中在"热通道"中,使冷却系统可以更有效地针对特定区域散热,而不必冷却整个机房。这种布局无需额外设备或空间,却能将能源效率提高多达35%。
Q2:服务器整合如何帮助节省电力?
A:服务器整合通过将工作负载从利用率不足的服务器迁移到其他服务器,实现用更少的服务器支持相同数量的工作负载。即使总计算能力相同,一台强大服务器的耗电量也会少于多台较弱服务器的总耗电量。
Q3:直接芯片冷却和浸没式冷却哪个更好?
A:浸没式冷却比直接芯片冷却更高效,将服务器浸没在非导电液体中散热效果更佳。但成本也更高,浸没式冷却每机架约26500美元,而直接芯片冷却约5000美元起。选择哪种取决于预算和长期节能目标。
好文章,需要你的鼓励
大多数用户只使用计算机预装的操作系统直到报废,很少尝试更换系统。即使使用较老版本的Windows或macOS,用户仍可通过开源软件获益。本文建议通过重新安装系统来提升性能,Mac用户可从苹果官方下载各版本系统安装包,PC用户则建议使用纯净版Windows 10 LTSC以获得更长支持周期。文章强调备份数据的重要性,并推荐升级内存和固态硬盘。对于老旧系统,应替换需要联网的内置应用以降低安全风险,定期进行系统维护清理。
新加坡南洋理工大学研究团队提出"棱镜假设",认为图像可像光谱一样分解为不同频率成分,低频承载语义信息,高频包含视觉细节。基于此开发的统一自编码系统UAE,通过频率域分解成功统一了图像理解和生成能力,在多项基准测试中超越现有方法,为构建真正统一的视觉AI系统提供了新思路,有望推动计算机视觉技术向更智能统一的方向发展。
微软杰出工程师Galen Hunt在LinkedIn上宣布,目标是到2030年消除微软所有C和C++代码。公司正结合AI和算法重写最大的代码库,目标是"1名工程师、1个月、100万行代码"。微软已构建强大的代码处理基础设施,利用AI代理和算法指导进行大规模代码修改。该项目旨在将微软最大的C和C++系统翻译为内存安全的Rust语言,以提高软件安全性并消除技术债务。
芝加哥伊利诺伊大学团队提出QuCo-RAG技术,通过检查AI训练数据统计信息而非内部信号来检测AI回答可靠性。该方法采用两阶段验证:预检查问题实体频率,运行时验证事实关联。实验显示准确率提升5-14个百分点,在多个模型上表现稳定,为AI可靠性检测提供了客观可验证的新方案。