在《流浪地球2》中大家有没有留意两个画面。
一个是刘德华饰演的图恒宇希望用超强算力让女儿的数字生命可以更长久,所以他和团队一直在研发550系列产品,在研发过程中,他的团队成员从制冷液中拉出一台机器进行检查。
另一个是重启地球发动机需要启动3个根服务器,刘德华则进入已经受损的海下数据中心,启动北京的根服务器,在最后倒计时前他把自己和女儿的意识储存卡插到550W上完成了启动。
这个两个画面的未来科技,在现实世界其实早已存在!原型就是曙光还未正式发布的“缸式”浸没液冷计算机。
中科曙光及旗下曙光数创早在十几年前就布局服务器液冷技术领域,拥有3000+计算技术相关专利,打造出全系列的液冷产品。
曙光数创高级副总裁张鹏告诉记者,《流浪地球2》影片涉及的数字生命等前沿技术,都需要强大的算力支撑,所以片方也第一时间找曙光,咨询了2058年服务器应该是什么样子,曙光也给出了全浸式液冷服务器方案,符合他们对电影视觉上的诉求。
走出液冷技术的无人区
科幻电影为科学技术的发展埋下浪漫合理的想象种子,但其本身是根植于现实工业基础与科技发展,《流浪地球2》也让更多人知道了浸没式液冷技术。
其实在上个世纪80年底,国外液冷技术已经有了探索,而国内还未开始,此时,中科曙光就率先开启了对液冷技术的探索。
进入本世纪之后,液冷从服务器领域进入更广阔的数据中心领域。尤其是在中国提出“双碳”战略之后,让液冷技术在国内得到了迅速发展。
在2011年底曙光内部就进行了立项,2012年经过了多番讨论,确定了冷板式液冷散热和浸没式液冷两个研发方向。
到了2015年,曙光第一批商用的冷板式液冷的设备上线,曙光也收到了大量应用场景的信息反馈,进一步改善液冷技术。
随后2017年曙光又推出了浸没式液冷服务器的原型机,2018年又推出了第一套商用化的浸没液冷的设备,形成了完善的液冷产品组合。
张鹏解释称,从PUE看,风冷大概是1.2到1.5数量级,冷板能则可以做到1.1到1.25。目前,曙光部署的冷板式液冷能够让PUE降低到1.15-1.2之间,而浸没式液冷,特别是相变液冷,能将PUE控制在1.04到1.07之间,可以实现数据中心大幅度的节能降碳。
曙光自主研发的浸没式相变液冷技术以液体作为冷媒,将设备内部的CPU、内存、电源系统等发热部件产生的热量通过相变换热的方式转移出IT设备,再与水做热交换,最终将热量排出,以达到良好的降温节能效果。
据统计,若全国50%新建数据中心采用相变液冷技术,每年可省450亿度电,减排3000万吨二氧化碳。
目前一个标准化风冷机柜的功耗是5到8个千瓦,而未来五年,这会增加到15千瓦或者30千瓦,而当功耗上升到10千瓦,液冷会是首选散热方式。从投资成本角度看,总体拥有成本(TCO)也是最优的。
突破浸没式液冷的“难题”
目前在液冷服务器中冷板技术应用更多,比如发动机就是典型的冷板散热。冷板的难点更多在于产品设计和工艺,包括对服务器结构的理解,技术原理比较简单,目前全球很多大型数据中心都有应用。
全浸没式液冷是将主机、服务器放在一个高绝缘(不导电)、热稳定性非常好的一种氟化物里面,这样散热的均匀性更好。
但是浸没式液冷需要突破很多难题,比如冷媒的物性、毒理、热参数要非常合适。
电子元器件涉及到的材料太多,除了硅之外,还有很多金属类材料,这就要求冷媒一方面是跟材料不会发生任何的物理化学反应,另一方面是电信号、光信号不会受到干扰,现在在氟化物的液体中,环境是变化的,要确保SI(信号完整性)。
张鹏还提到,另外一个需要处理的难题是密封性,如果只是一个静密封,其实也并不难,而要实现动密封,因为服务器还要维护,涉及转接、插拔,这是结构的难题。
但曙光相信,冷板式液冷考虑了已有数据中心架构的设计,从某种意义上看是过渡性方案,而浸没式液冷才是终极趋势。
液冷数据中心已在路上奔跑
液冷技术正在从实验室走向商业应用,从小规模验证技术走向大规模量产技术阶段,推动数据中心向液冷技术发展也成为行业共识。
但张鹏介绍说,浸没式液冷由于改变了服务器的形态,供电方式、机房建设模式都会有很大的变化,以及用户的使用、运维、维修、更换、检查习惯需要一个接受的过程。传统数据中心进化为液冷数据中心还需要有很长的路要走。
现有面向互联网、通信、金融等行业的数据中心至少还得需要十到二十年的时间才能从风冷逐渐切换到以冷板为主流的液冷模式。
目前互联网巨头的新建数据中心至少百分之三四十采用了冷板式液冷服务器。而对于大势所趋的浸没式液冷,由于从基础设施、数据中心、机房到整个服务器都要重新设计,所以需要更长时间才能全面推动。
不过,凭借先发优势,曙光在技术研究、产品化和商业化进行了探索,进一步改善了冷板式液冷设计中的漏液检测、材料兼容性、生产工艺等核心技术要点,并在浸没式液冷中的安装运维、液体挥发与渗漏、材料兼容性等难点问题上实现突破。
由曙光建设的国内首个标准化液冷数据中心,已持续稳定运行超2500天。曙光参建的液冷数据中心加起来,一年总节电量可达2亿度,这些电能可满足125000个中国家庭全年需求。
为了完善产业链,曙光也在积极参与液冷行业标准的建立,瞄准液冷技术关键部件,降低设计与使用成本,推动建立并完善液冷的生态系统,这样客户无需改造机房,也可实现液冷服务器的部署。
随着社会对算力需求的增加,企业需要考虑更先进的冷却方式。如今,先进计算和人工智能领域应用很广泛,都需要大量的算力支持,高密度功率的数据中心需求持续增加,浸没式液冷会是最佳选择。
物换星移,液冷会像风冷一样,随着产业链的成熟和分工,让《流浪地球2》中的场景变为现实,那时我们的数字生活会更加丰富,我们的地球也会更加绿色。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。