新华三:全方位解决AI大模型时代算力挑战 原创

随着模型规模的扩大,能源消耗和计算资源需求也在不断增加,因此在发展AI大模型的同时,也需要关注节能和可持续发展问题。而新华三所秉持的All in GREEN理念,为AI大模型建设一个高效、环保、绿色的家。

为什么新华三会将AI大模型看做十几年间少有的一次全局大变革?从电脑诞生后的应用就可以清楚理解。

在ChatGPT出现之前,电脑对于绝大部分用户而言,主要是用在游戏和视频播放等娱乐用途,而在办公应用中,用的最多的也只是文字输入、编程和制图。而当ChatGPT出现之后,人们可以让电脑自己去翻译、编程、写诗、画画,甚至去猜高考的作文题目……

虽然ChatGPT可以提供广泛的帮助,但是它可能并不总是100%准确。在关键决策或专业领域时,还需要进一步核实信息并咨询专业人士。即便如此,以ChatGPT为代表的AI大模型技术出现后,人们可以让电脑去完成的工作,也开始变得越来越多,可能对行业和客户都会产生深远的影响,有可能类似于二十年前互联网出现那时候一样,改变了很多的个人、企业,甚至于整个IT圈的业务。

AI大模型所面临的算力挑战

然而目前AI大模型,尤其是深度学习模型,面临着多方面的算力挑战:

首先是对计算资源需求,AI大模型需要大量的计算资源进行训练和推理。这些模型通常有数十亿甚至数百亿个参数,需要大量的计算能力来处理。这对硬件设备(如GPU、TPU等)和计算平台的性能要求非常高。

其次是存储和内存限制,AI大模型需要大量的内存和存储空间来存储参数、梯度和中间计算结果。这对硬件设备的存储和内存容量提出了很高的要求,同时也增加了数据传输和通信的压力。

还需要应对并行计算和分布式训练问题,为了应对AI大模型的计算挑战,研究人员通常采用并行计算和分布式训练的方法。然而,这些方法在实现上也存在挑战,例如如何有效地划分任务、协调各个计算节点的通信和同步等,否则一旦数据同步出现问题,大量计算工作就会白白浪费。

除此之外,AI大模型还面临长期运行的能耗、软件和硬件协同优化等多方面的挑战。

新华三的ALL in GREEN

新华三作为少有的一家可以将ICT各个领域都做到一个较高水平的公司,早在2020年的领航者峰会上,就已经发布了AI in ALL 战略,并宣布将人工智能融入所有产品线。如今在2023 NAVIGATE 领航者峰会上,新华三集团副总裁、计算存储产品线总裁徐润安进一步向我们分享了新华三发布的“ALL in GREEN”理念,这不仅实现了交换机、服务器、微模块等不同产品的液冷改造,也将液冷技术全面融入到全新的UniServer G6系列服务器中,在优化碳排放的同时降低运营成本,打造PUE<1.1的极致数据中心。此外,他也向我们说明了“ALL in GREEN”如何全方位的解决AI大模型所面临的算力挑战。

算力方面,全新的H3C UniServer G6和HPE Gen11系列服务器性能再度升级,AI算力提升高达10倍,通用算力性能提升53%,数据分析效率提升3倍。面向AI全场景,新华三已发布专为大模型训练的智能算力旗舰H3C UniServer R5500 G6,以及适用于大规模推理/训练场景的多元算力引擎H3C UniServer R5300 G6等,形成布局完善的智慧计算产品矩阵。

近期,R5500 G6 AI服务器获评“2023年度十大卓越高性能服务器”,其搭载NVIDIA HGX H800 8-GPU模组,6个NVSwitch实现GPU之间高速、全互联通信,可有效提升AI应用运转,基于架构的重塑和模块化设计,可根据业务需求灵活选择CPU和AI平台,实现算力可进化。

存储方面,新华三重磅发布了全新“内生智能·成就智慧存储”战略,推出新一代X10000智慧存储,全方位提升AI支持能力,并全面升级AI存储智慧中枢到3.0的版本。进一步实现了系统资源的净空预测,帮助用户感知应用层面的压力与变化,从而掌握并理解业务规律,进行正确的分析与判断。同时,通过智能能耗监控,降低数据中心整体PUE。

为了应对并行计算和分布式训练的挑战,新华三集团推出了包括傲飞算力平台在内的全新一代智算解决方案。傲飞算力平台支持异构计算资源统一管理、多元算力资源智能调度。网络联接部分,同时支持400G RoCE和400G IB 两种组网,其中新华三400G RoCE解决方案经实际部署和第三方Benchmark测试,性能可与IB媲美,进而支持高效率的AIGC计算的连接。智算解决方案还支持8000节点的AI集群的调度能力,60万IOPS的分布式存储能力,匹配高性能并行数据处理的特殊需求。

能源管理方面,新华三的全栈液冷解决方案以统一的管理和智能运维,全面提升数据中心运维效率和可靠性,同时整机柜方案则可以实现数据中心部署密度的提升100%,让交付效率提升10倍。更重要的是,新华三提供的液冷解决方案能够以智能温控最大程度上减少制冷、散热这一关键环节的能耗,让数据中心的PUE降至1.1以下,每年减少碳排放1750吨,真正打造绿色节能的绿色数据中心。

为AI大模型建设绿色的家

当前,AI大模型的发展前景非常广阔,将在各个领域发挥重要作用。然而,随着模型规模的扩大,能源消耗和计算资源需求也在不断增加,因此在发展AI大模型的同时,也需要关注节能和可持续发展问题。而新华三所秉持的All in GREEN理念,可以在应对AI大模型高标准算力需求的同时,提供出提升自身的能源利用率,降低运营成本的同时优化碳排放,PUE<1.1的极致数据中心,为AI大模型建设一个高效、环保、绿色的家。

来源:至顶网计算频道

0赞

好文章,需要你的鼓励

2023

07/04

14:44

分享

点赞

邮件订阅