AI时代算力需求不断提升,液冷散热或将成为降低服务器功耗的有效方案。
站在全球视角,全球算力保持高速稳定增长态势。据华 为GIV预测,2030年人类有望迎来YB数据时代,全球算力规模达到56000EFLOPS。站在中国视角,据工信部,2023年我国算力总 规模达到180EFlops ,保持高位增长。算力规模大幅提升带来AI服务器需求暴增,大量高功率 CPU、GPU 芯片将带动AI服务器功耗 走高。当前数据中心制冷技术以风冷为主,考虑到机柜功率超过15kW为风冷能力天花板,而未来 AI 集群算力密度普遍超20kW/柜, 升级液冷需求迫切。
数据中心液冷技术发展现状
液冷技术影响着数据中心的设计、选址、建设、交付和运维。数据通信设备的液体冷却系统的冷却子系统可以认为是一种液体回路, 其中冷却液体与要冷却的部件做热交换。有些情况下,冷却系统的水由机架由CDU提供,也可以由服务多个机架的外部CDU提供。
数据中心液冷系统多样,冷板冷却系统为主。国内外在数 据中心液冷方面已有一定研究基础并已取得了突破性进 展,正成为变革性技术。液冷技术根据液体与IT设备接触 状态,可以分为间接液冷、直接单相液冷和直接两相液冷 三类。其中间接冷却中的冷板冷却是如今液冷数据中心采 用最广泛的散热冷却方式。
目前数据中心散热需求下,冷板冷却效果最佳。如图所 示,冷板冷却是将金属冷板与IT设备芯片贴合,液体在冷 板中流动,芯片发热时将热传导给冷板金属,液体流过冷 板时升温,利用显热将芯片热量带出,通过管道与外界冷 源进行换热,是芯片级别的冷却方式,使用最多的冷却介 质是水。冷板冷却是如今液冷数据中心采用最广泛的散热 冷却方式,使用的是液冷和风冷相结合的方法,对芯片采 用液冷,对硬盘等其他电器元件采用风冷,并非严格意义 上的单纯液冷 。与风冷最多冷却30 kW/r的机柜对比,冷 板能冷却小于45 kW/r的机柜更节能且噪音小,不需要昂 贵的水冷机组,与纯液冷对比也有一定优势。
好文章,需要你的鼓励
开放闪存平台(OFP)旨在用直接访问的闪存盒替代全闪存阵列,每个闪存盒配备控制器DPU、Linux系统和并行NFS软件。该倡议由Hammerspace主导,针对新云、超大规模和AI公司在数据中心设计演进中面临的基础设施限制。OFP通过结合IPU/DPU技术、闪存优化机箱和Linux协议,提供高密度、低功耗的存储解决方案,满足AI应用从PB级向EB级数据容量需求的扩展。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
ERP系统市场近年来相对稳定,但AI正在改变一切。供应商们正竞相在产品组合中嵌入AI功能,构建包括可组合应用、集中数据存储和可扩展云平台的生态系统。Oracle凭借AI投资超越SAP成为ERP收入领导者,而AI代理已从实验阶段进入实际应用,能够管理整个工作流程并进行自动化决策。本文盘点了Oracle、SAP、微软等十大最具影响力的ERP厂商及其AI战略。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。