42度的机房,服务器又因为高温而出故障了,脸上因为全是汗,所以推上去的眼镜儿一个劲儿的往下滑,工服湿热地贴在身上,为了防尘而穿得鞋套让双脚烧一般的难受,仰脖控了控杯子里已经温了的水,你开始想要… …好了别想怎么才能砸了这个机房了,还是从头开始认真考虑考虑服务器散热的问题吧。
在服务器热管理问题上,有两个法则:10℃法则是指单个电子元器件的温度每升高10℃,电子设备的可靠性下降50%;1℃法则是指单个电子元器件的温度每下降1℃,电子设备的故障率下降4%。我们也可以看到,在一些历次重大事件中,均有温度过高导致电子元器件故障引发的灾难性后果,服务器温度控制的重要性显而易见。为了让服务器在寿命方面延长使用、化学方面提高环保能力、在人员方面保障人员人身健康、以及机械方面保证元器件稳定、还有最重要的保证性能,服务器热管理亟需实施。为解决上述问题,华为迅速行动,即将发布下一代V5服务器。V5服务器与华为以往推出的的服务器既有相同之处,又存在着大大的不同。
服务器的质量口碑在散热这个分支点上,看似很好获得,实则不然。下一代V5服务器全面继承了华为服务器的技术能力,“质量基因”强大。根据业界知名互联网及金融公司的统计,华为服务器的故障率低于业界15%,其中华为服务器的热管理功不可没。华为服务器的技术开发人员认为,“风为热而来,热因风而散。散热,其实就是一场风与热互相追逐的故事。”所以,下一代V5服务器的前置面板,采用独特的蜂窝状开孔设计,可以有效增加进风面积,提升进气效率且不影响物理结构强度,为风敞开大门,带走服务器内部的热量;在门内,采用流线型风扇框,双层对旋风扇设计,提升风压与加速风的流动速度,让风纵情奔跑。
值得一提的是,华为新一代V5服务器中,还首次使用了新研发的散热专利设计方案——3D VC。3DVC散热技术,是总结华为多年积累的服务器散热经验,通过VC与热管通过毛细烧结的一体化成型工艺,在热管内部适量的低温高挥发液体,让液体在热端受热后快速蒸发,到冷端冷凝后通过管壁的毛细孔的毛细效应回流到热端,如此循环往复而达到散热目的的技术。通过这种毛细烧结工艺及液体的相变过程,大幅提升了服务器的散热面积与散热系数,从而提升了散热效率,同时节约了能耗。
据下一代V5服务器的研发人员介绍,服务器的散热设计都需要经过严苛的测试,包括HALT等四处极端测试及硬盘抗震设计。华为还在不断优化CPU的散热设计,CPU散热片历经7代的演进延续,CPU的散热器技术也从简单的纯金属结构,走向局部的相变均温以及整体的相变均温技术,支持的CPU功耗也数年前的几十瓦到现在的两百多瓦。
当然,还有一种情况,比如服务器中的主要热源CPU,这里是风到不了的地方,如何把热引出来成为了难题。下一代V5服务器的研发人员背靠技术实力进一步创新,专门为服务器中的主要热源CPU量身定制了合金散热器,并使用热管塔式焊接工艺焊接,热管散热可以解决横向均温和纵向把热传递到翅片,使热在翅片平面内迅速扩散进行换热,从而提升CPU的散热效率,让热无处可藏。
实际上,服务器遇到难题挑战总是层出不穷,比如当企业新兴业务不断发展,数据流量急剧增长,数据量急速膨胀时,服务器要顶住压力的同时还要具备高的处理效率。面对业界发出的新需求,华为坚持创新,面向全球布局研发机构,并将每年营业收入的10%投入研发,在Gartner的象限挑战中,稳居全球市场TOP3。
另外,下一代V5服务器“创新基因”也体现在对抗热辐射上。热具有热辐射的特性。为避免服务器内部多个CPU或模块之间的热辐射干扰,下一代V5服务器的研发人员通过专利设计的分流式导风罩,既可以让前面CPU的热温,通过倒风让其走到后面CPU的两侧来,也可以把冷风从前面CPU的顶部引导到后面CPU上来,从而消除级联加热,避免传统的多颗CPU前后影子布局带来的热干扰。另外,在服务器内部还采用了前面节点风道与后面IO模块风道相互独立的设计,大幅提升散热效率,为服务器性能的稳定发挥保驾护航。
即使有技术为盾、创新为矛,散热设计也不能仅凭感觉或经验,还需要辅以科学的检测工具与方法。下一代V5服务器热仿真监控模块可以直观的展现服务器机房的热力成像图,是追踪服务器内部热点聚集的有力武器,再辅以FDM深度故障诊断,让热无处遁形,使服务器发挥最大能效。
据悉,华为新一代V5服务器中,还首次使用了多种新研发的散热专利方案,如纵向涡、可拆分翼型散热结构等,让服务器运行更稳定,性能发挥更出色,满足企业用户未来3-5年的技术发展要求。华为目前已经设立了卡诺实验室,开始了前瞻性的散热技术预先研发,华为服务器将继续在每一个不被注意的细节点上,追求散热效率的极限。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。