虽然液冷成为未来数据中心的首选,但是液冷产业标准不完善,用户获取成本和使用门槛高的问题依然突出,如何化解这一难题?
近日,浪潮信息与英特尔联合发布全球首个全液冷冷板服务器参考设计,并面向业界开放,为全球液冷产业链上下游提供极具价值的参考样板,推动先进全液冷冷板解决方案在全球数据中心的大规模部署应用,实现数据中心更加绿色低碳可持续发展。
产业化程度比较低是液冷规模化落地的最大挑战
当下,算力是热门的话题,毕竟ChatGPT为代表的大语言模型对于算力的需求持续攀升。为了增大算力供给,现在芯片的功耗越来越高,随之散热的需求也在增加。在过去十年,CPU 热设计功率(TDP)几乎翻了一番,而GPU热设计功耗已从2008年的不足200W到目前的700W。
中国信息与通信研究院产业与规划研究所副总工程师王青表示,根据测算,当芯片的制程演进到10纳米的时候,整个芯片的性能每提升一倍,功耗至少要提高30%到40%,而散热能力决定了整个芯片的性能发挥。
在这样的背景下,液冷技术成为数据中心的首选散热方式,液冷的“热度”不断增加。根据IDC的数据,2022-2027年,中国液冷服务器市场年复合增长率将达到54.7%,2027年市场规模将达到89亿美元。未来,中国将成为液冷技术应用最大的试验场,据测算,预计到2025年中国液冷数据中心市场规模将达20%以上。
虽然这样的数据令业界激动不已,很多客户也对液冷技术跃跃欲试,但是液冷技术在数据中心的落地并不是顺畅。浪潮信息服务器产品线总经理赵帅告诉记者,2023年与浪潮信息交流液冷技术的客户数量增加了10倍以上,但是实际部署的也就占了交流客户的十分之一。
为什么会出现这种情况呢?除了技术难点,在赵帅看来,产业标准化程度比较低是液冷技术规模化落地的最大挑战。由于液冷产业标准不完善,产业链上各个企业技术路径多种多样、产品规格千差万别,产品质量良莠不齐,各液冷模块无法兼容,让用户难以选择。
比如用户的现有数据中心存在多品牌和类型的服务器,是否能够引入液冷服务器是个大问题。而解决这样问题的关键是标准化。
产业化的表现是批量化和规模化,但是现在液冷产业的生产厂家少,用户购买和部署成本高,同时各家的产品之家不能对接和互通,这样无疑增加了用户的成本。“标准的意义是推动规模化,互联互通才能降低门槛,让市场快速发展。”赵帅说。
全液冷冷板服务器最佳实践
正是由于开放标准的重要性,浪潮信息、英特尔还与中国电子技术标准化研究院、开放计算标准工作委员会OCTC联合发布了《全液冷冷板系统参考设计及验证白皮书》,包含冷板式液冷技术优化方向,冷板全液冷服务器系统架构设计、关键部件设计、性能测试,铝冷板全液冷方案设计与测试,以及冷板液冷技术应用拓展等主要内容,对全液冷服务器设计和规模应用中面临的主要难点和痛点提供了设计参考,对全液冷冷板技术在通用产品上实现快速导入和推广具有重要指导意义。
2022年起,浪潮信息联合英特尔率先针对基于通用服务器架构的全液冷冷板技术方案进行研究与实践,深耕通用高密服务器液冷优化设计。浪潮信息数据信心产品部副总经理李金波表示,过去一年,几十位浪潮信息和英特尔的资深工程师经过了各种设计、打样、测试、验证,共同完成了这部白皮书。
在众多液冷方式中,冷板式液冷在对数据中心与服务器架构的改造程度、产业链成熟度、部件更换运维便捷性、初期投资等方面有突出优势,而且冷板液冷技术发展正逐步向全液冷演进。
浪潮信息与英特尔联合发布的全球首个全液冷冷板服务器参考设计实现了CPU、高功耗内存、NVMe硬盘、OCP网卡、电源、PCIe转接卡和光模块等服务器主要发热部件的冷板全液冷覆盖,首创的内存枕木散热器液冷方案结合了传统风冷散热和冷板散热的优势,比现有的管路(Tubing)内存液冷方案,更加易于组装和维护,且通用性更强。
基于该参考设计,浪潮信息推出全液冷冷板服务器,实现服务器部件接近100%液冷散热,达到PUE值接近于1的极致水平。以部署浪潮信息高密度服务器i24M7的数据中心为例,在风冷散热条件下数据中心PUE为1.58,采用风液混合散热PUE可降至1.16,而全液冷冷板散热则可将PUE降至1.05以下,实现最佳的节能降碳效果。
赵帅表示,经过丰富的产品实践和产业实践,我们把发现的问题形成标准和指导规范,向产业开放,跟客户产生共鸣,消除客户顾虑。这个共鸣就是产业价值,加速液冷的快速部署。“在适宜的产品上应用适宜的技术,有了产业上游最强大的结合,我们给客户带来信任感,经过产业化实践认可的产品和标准能够进行批量化、大规模的部署和快速落地。这是我们现在所做事情的价值。”
“从0到1很重要,从1到N也同样重要。我们解决的是从1到N的事情,真正打通液冷产业的最后一公里。同时,我们把源自于国内的标准变成国际标准,全球用户都可以享受到来自中国市场的最佳实践。”英特尔解决方案咨询顾问李昌中说。
将绿色算力进行到底
如今,高质量发展成为算力基础设施的共识。2023年10月,工业和信息化部等六部门联合印发的《算力基础设施高质量发展行动计划》,提出完善算力综合供给体系等六方面重点任务,着力推动算力基础设施高质量发展。
王青表示,高质量的算力基础设施具备四个特点:多元泛在、智能敏捷、普惠赋能、绿色安全。特别是随着算力需求的持续增长,绿色化和低碳化是算力发展的一个非常重要的特征。
在浪潮信息看来,高质量算力采用先进的计算架构,具备高算效、高能效、可持续、可获得、可评估五大特征。其中,高能效是指在最低碳排放前提下实现最大化算力输出,确保能源利用最优解。
赵帅指出,高能效的本质是实现全生命周期的绿色计算,让算力可持续发展。算力中心是耗电大户,国家双碳背景下,节能降碳、提高算力能效,既是算力产业的共同使命也是国家要求的硬指标。因此,绿色算力成为高质量算力的重要支撑。
对于发展绿色算力、实现高能效,浪潮信息认为,不仅局限于能耗PUE,算力全生命周期都存在碳排放,需要从绿色采购、绿色设计、清洁生产、绿色包装和运输、绿色运营、回收处理的算力全生命周期进行碳足迹管理,推进全产业链节能减排。
例如采用液冷先进散热技术,浪潮信息已实现服务器全线产品支持冷板式液冷,首创液环式真空CDU,从根源解决漏液问题,发布全液冷机柜,具有一柜顶十柜的高算力密度,年平均PUE可低至1.1以下,单柜每年可节省电费21万元,并提供从数据中心的规划、建设到实施全套的绿色化解决方案,还可根据客户所处环境,帮助客户采用模块化、预制化等不同建设模式,最大程度上实现节能降碳。
为全面推进绿色计算,浪潮信息提出了“低碳、高效、健康”的绿色算力理念,从服务器基础部件到整机系统,再到整个数据中心,在算力生产、运营与服务各环节,通过绿色设计、清洁生产、绿色包装和运输、绿色运营、回收处理、绿色采购等方面实现算力全流程的绿色化,从而促进绿色算力在企业的广泛应用。
目前,以液冷为代表的先进绿色节能技术缺乏行业标准,亟需建立绿色节能技术体系化标准。此外,现有的绿色算力评估体系多聚焦单一维度,对算力的能效评估缺乏深入研究,限制了绿色算力的应用广度和效果。
浪潮信息已参与制定并发布了十余项液冷相关设计技术标准,牵头编制并发布了国内首批冷板式液冷核心部件团体标准,填补了冷板式液冷数据中心标准的空白;同时,牵头制定了《集装箱式数据中心机房通用规范》《模块化数据中心通用规范》国家标准。
此外,浪潮信息还围绕部件、节点、整机、数据中心等各层级建立绿色评价体系,并发布碳排报告。其中,浪潮信息与中国信息通信研究院联合发布《绿色算力白皮书》,构建并发布“绿色算力评测体系”,在行业内首提服务器“算力/碳排放量”对应关系,推出了业界首个服务器碳排放评测标准,在达到服务器性能要求的前提下,满足低碳、绿色、PUE等要求,实现最小颗粒度的碳排放量化可视指标,将有效推动绿色节能服务器设计发展,并为用户选择最优绿色算力平台提供重要参考依据。
浪潮信息持续践行“All in液冷”战略,全栈布局液冷,并提出了2025年实现风液同价的目标。“我们希望通过产品技术创新、标准建立、开源开放,与上下游协作交流,最大化降低数据中心用户液冷的使用门槛,更好地驱动数据中心迈入液冷时代。”赵帅最后说。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。