近日,由普洛斯数据中心牵头并联合ODCC专家组及行业上下游16家单位共同编制的《基于冷板式液冷的智能监控技术报告》(以下简称《报告》)在“2024开放数据中心大会(ODCC 2024)”上正式发布,并荣获ODCC优秀项目奖。该《报告》填补了算力中心冷板式液冷项目监控技术方面行业报告的空白,为推动冷板式液冷技术的广泛应用和标准化发展提供了重要的技术参考。
《基于冷板式液冷的智能监控技术报告》
《报告》中介绍的监控系统技术及案例,均来自于GLP DCBASE智慧化运营管理系统的落地实践。GLP DCBASE是普洛斯自主研发的面向多数据中心的中央统一管控平台,采用了业内领先的中心化管控模式,基于物联网技术,结合大数据处理、AI 算法、图形图像分析等技术,构建数据中心全新的智慧化监控、运行、维护与保养等管理能力,提升数据中心整体稳定性、可靠性和安全性。最新发布的GLP DCBASE 3.0版本,已应用于普洛斯怀来数据中心、普洛斯常熟东南数据中心等多个冷板式液冷项目中,有效保障了数据中心的安全可靠运行。
GLP DCBASE智慧化运营管理系统
聚焦冷板式液冷技术 赋能算力中心高效可持续发展
面对AI大算力需求带来的高密度、高功耗的服务器散热挑战,液冷技术逐渐成为突破散热瓶颈,降低数据中心PUE的关键技术。其中,冷板式液冷作为一种较为成熟的液冷解决方案,已在行业内被广泛采用,并展现出一定的效果和规模。根据ODCC资料,冷板式液冷能够满足20kW到50kW以上高功率机柜的供冷需求,可将算力中心PUE降到1.2以下,显示出明显的技术优势。
在冷板式液冷项目的实际运维当中,仍面临诸如漏液风险等挑战;要应对这些情况,除了依靠运维工程师的专业经验外,只能通过监控系统来进行监测和预警。因此,智能监控技术是冷板式液冷系统长期稳定运行的关键因素,并将成为冷板式液冷项目的标准配备。在ODCC智能运营组的指导下,普洛斯数据中心联合行业内16家单位的专家,共同编写了此报告。这是国内首次系统化制定出的一套相对完善且可靠的冷板式液冷监控方案,旨在助力打造绿色低碳、弹性高效的算力基础设施。
基于普洛斯数据中心在冷板式液冷项目上的设计、交付、监控、运维的经验,《报告》将冷板式液冷监控技术分为控制层技术和管理层技术两大部分。其中,控制层面向设备,需要保证设备的正常运行,主要包括冷板式液冷的核心设备:CDU、室外冷源(干冷器、冷却塔)的监控;管理层则面向冷板式液冷的整体项目,需要确保整个项目的安全和高效运行,在监控管理范围层面,除了CDU、室外冷源之外,还包括对配套的空调系统、配电系统、环境监测传感器的集中监测和管理。
《报告》围绕冷板式液冷智能监控技术,重点提出了包括CDU监控技术建议、室外冷源监控技术、DCIM管理层监控技术、智能监控技术等四大部分在板冷式液冷项目中的应用建议,并结合实际应用案例,提供了设计建设过程中的详细建议和技术指导,从而实现不同场景下确保系统安全运行、优化系统能效的目标,为冷板式液冷算力中心的建设和运维提供了新的思路和指导。
全新发布GLP DCBASE 3.0 助力冷板式液冷技术加速落地
今年全新升级的GLP DCBASE 3.0版本实现了多项升级:一、新增本地+中心双系统异地双活的能力,有效提升业务系统连续性;二、增加了设施、运维等全场景数字地图功能,进一步提升系统精细化、智能化运营水平;三、新增液冷监控能力,并同时覆盖冷板式液冷与浸没式液冷双场景。
目前,GLP DCBASE 3.0已为普洛斯数据中心旗下包括冷板式液冷项目在内的多个项目的绿色、安全、稳定运行提供了全方位的支持和保障:
GLP DCBASE 3.0已应用于普洛斯数据中心旗下多个数据中心
GLP DCBASE 3.0智慧化运营管理系统已应用于普洛斯旗下多个数据中心,监控点位数量超过1000万/10秒。此外,GLP DCBASE 3.0也成功对外输出,现已被某互联网头部客户采纳使用,助其通过实时运营数据分析及计算服务,实现一站式智慧化运营管理。
随着AI技术革新驱动的高算力需求不断增加,冷板式液冷技术应用有望成为数据中心制冷技术的主要发展方向之一,也是实现绿色算力和双碳目标达成的重要举措。未来,普洛斯数据中心将继续聚焦包括冷板式液冷在内的多项低碳节能创新技术,打造高标准绿色算力基础设施领域的数智积淀,并不断输出创新成果,推动数据中心行业低碳可持续发展。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。