8月5日,在“绿色节能液冷数据中心高峰研讨会”上,《绿色节能液冷数据中心白皮书》(以下简称“白皮书”)正式发布。该白皮书是2023年首部,详解数据中心节能技术与标准的手册型白皮书。白皮书就数据中心的节能设计、建设,以及设施与设备验收等“全周期”维度给出了详实理念与标准范例。
白皮书发布仪式现场
白皮书由国家互联网数据中心产业技术创新战略联盟、中科曙光和其子公司曙光数创联合主编。据赛迪顾问《2023中国液冷应用市场研究报告》显示,2021年至2023年H1,曙光数创以58.8%的市场份额,位列中国液冷数据中心基础设施市场部署规模第一。
让液冷建设不再难
伴随“东数西算”战略启动,以及“双碳”目标的提出,如何解决数据中心能源利用率低、节能技术水平不足等问题,已成为数据中心建设的首要难题。
对此,国内众多厂商纷纷进行液冷技术的探索与尝试,以实现更低PUE等目标。但因参与厂商众多,带来了理念不一、成果与案例难以参考、复制等新问题。而白皮书的发布,则为新型节能数据中心的建设与运维,提供了建设方向以及设计准则。
曙光数创总裁何继盛介绍,白皮书的编写依托中科曙光及其子公司曙光数创多年的技术积累与市场经验。就如何实现数据中心低PUE下的高密度部署、液冷数据中心持续可靠运行、以及节能数据中心全年全地域建设运维等问题,提出了历经多年检验的理念与标准范例。
弥补标准缺失难题
近年来,众多团体、协会为推动液冷技术在数据中心的应用与普及,纷纷牵头液冷技术的标准立项编制工作。但百“标”齐放,未能让液冷数据中心的设计建设、节能设备验收、液冷机房运维等环节简便与清晰。这致使不少液冷数据中心在建设之初,普遍缺乏可持续的信心。
对此,白皮书围绕冷板式液冷、单相浸没液冷、相变浸没液冷三大主流节能液冷技术展开,在环境、性能、部件设计、运维规范等多方面提出具体要求,为液冷数据中心的规范化设计、建设等提供参考依据,弥补标准缺失难题。
曙光数创副总裁张鹏介绍,曙光一直深耕数据中心基础设施液冷技术和产品应用,先后主持参与、制定数据中心相关节能标准共20预余项。以曙光液冷数据中心方案为例,其可让散热耗能占比,从传统风冷模式的超30%,降低至9%,PUE降低至1.2以下。如同等IT容量规模为40MW的数据中心,相比传统风冷模式,使用曙光浸没相变液冷方案,每年可节省电费3500万元。
相信白皮书可成为液冷数据中心建设的“百宝箱”,让国内液冷数据中心建设能有标所依,有规可循,助力“双碳”目标早日实现。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。