浪潮王恩东:智算中心是智慧时代的新基建

4月9日,在IPF2020(浪潮云数据中心合作伙伴大会)大会上,浪潮集团执行总裁、浪潮集团首席科学家王恩东提出,智算中心将成为智慧时代经济社会运行所必须的重要基础设施。

4月8日武汉解除封城,中国已经取得抗击疫情的阶段性胜利。这次疫情让人们重新认识了新一代信息技术的价值,云、大数据、AI等信息技术不仅支撑着工作、生活、交流的线上化,也渗入到了人流体温监测、流行病学调查等疫情防控的环节中。中央提出加速新基建,建设社会数字化转型所需要的ICT基础设施,也为社会智慧化升级按下了加速键。

4月9日,在IPF2020(浪潮云数据中心合作伙伴大会)大会上,浪潮集团执行总裁、浪潮集团首席科学家王恩东提出,智算中心将成为智慧时代经济社会运行所必须的重要基础设施。

浪潮王恩东:智算中心是智慧时代的新基建

智算中心将成为智慧时代的基础设施。智算中心之于智慧社会,就像水利、交通之于农业社会,铁公基、电网之于工业社会。

王恩东表示,计算力就是生产力,智慧计算改造升级了生产力三要素,最终驱动了人类社会的转型升级。智慧计算将劳动者由人变成了人加上人工智能,劳动者可以呈现指数增长;智慧计算将数据变成了一种新的生产资料,从有形到无形,生生不息,越用越多;智慧计算将计算力驱动的信息化设备变成了生产工具,也是指数增长,生产力得到了前所未有的解放。

计算力在智慧时代的核心地位,决定了智慧时代的核心基础设施必然是计算力的生产中心。

计算是在发展的,从最初的数值计算逐渐演变为科学计算、关键计算和智慧计算。每种计算都有相应的算力中心去支撑。承载科学计算的算力中心是超算中心。承载当前企业应用、政府应用和个人应用的算力中心是数量众多的各类数据中心。当前人工智能计算需求正呈指数级增长,未来在社会总计算需求中将占据80%以上,承载这种需求的就是AI算力中心,即智算中心。

智算中心是智慧时代最主要的计算力生产中心和供应中心,以融合架构计算系统为平台,以数据为资源,能够以强大算力驱动AI模型对数据进行深度加工,源源不断产生各种智慧计算服务,并通过网络以云服务形式向组织及个人进行供应。

智算中心要成为新基建,必须满足三个要求:开放标准、集约高效和普适普惠。

  • 开放标准,要求智算中心从硬件到软件、从芯片到架构、从建设模式到应用服务都应该是开放的、标准的。
  • 集约高效,要求智算中心的建设要有超大规模,要采用领先的技术,保证自身的先进性。
  • 普适普惠,则要求智算中心发挥基础设施的社会价值,服务大众。

从软件到硬件,从芯片到数据中心,开源开放的IT软硬件基础,让构建智算中心成为可能。

目前ICT产业开放的边界已经越来越广阔,这为智算中心的开放标准提供了坚实的基础。

从最初的操作系统、数据库、中间件的开源到云和大数据、算法框架等基础软件的开源,再到以RISC-Ⅴ为代表的芯片的开放,以OCP、ODCC为代表的计算硬件的开放。由软件到硬件,从芯片到数据中心,开放变革了IT产业的生产模式和应用服务模式,持续推动着信息技术的发展,促进了整个IT产业的生态繁荣。开源开放的IT,是一个健康的IT。开源开放的软硬件,才是智算中心建设的需要。

代表数据中心最高发展水平的顶级互联网数据中心已经大规模部署了OCP、ODCC开放计算服务器,通信、金融、能源等关键领域的TOP企业也纷纷加入这些开源组织并在数据中心建设中加以实践。像OpenStack、K8S、Hadoop、TensorFlow等面向云计算、大数据、人工智能等场景的开源基础软件,已经成为了智算中心软件平台的事实标准,超过80%的企业都在其数据中心中应用了开源软件技术。开放计算给这些用户带来了巨大的价值,浪潮一个客户在某个大型数据中心使用开放计算技术后,节约电力30%,系统故障率降低90%,投资收益提高33%,并且运维效率提升3倍以上,交付速度可达到每天1万台。

浪潮多年来一直践行开放计算的理念,引领开放计算的标准,是全球唯一的三大开放组织发起成员或白金会员,牵头了服务器全部国标,是OpenStack黄金会员,社区贡献中国第一,同时还是SPEC ML主席。我们持续定义领先的开放计算产品,拥有全球唯一符合三大开放标准组织的整机柜产品,拥有全球架构最全、配置最多、规格最高的开放计算服务器,最先开发了开放技术的OAM加速计算模块和OTII边缘计算服务器,拥有全球性能领先的存储系统,和性能、安全性领先的云海OS。

基于融合架构体系的智算中心,可以让部署了几十万台服务器像一台计算机一样高效工作。

融合架构代表着数据中心体系结构的未来发展方向。融合架构就是硬件重构与软件定义,融合架构可以让部署几十万台服务器的智算中心像一台计算机一样工作,从根本上改变了智算中心资源的利用方式,实现了高效集约。

目前融合架构正处于3.0阶段,通过连接、池化和重构的技术,实现不同计算资源的自动化协同,通过软件定义实现业务自动感知和资源自动重构。

硬件层面,通过硬件重构实现资源池化。例如CPU与GPU、FPGA、xPU等各种加速器将更加紧密结合,利用全互联的新型超高速内外部互连技术,实现异构计算芯片的融合;与此同时,计算资源可以根据业务场景实现灵活调度;NVMe,SSD,HDD等异构存储介质则通过高速互连形成存储资源。

软件层面,通过软件定义,在可重构的硬件资源池基础上,通过灵活的组织,将不同的资源池组成专业的服务器、存储、网络系统,并实现资源的高效管理和调度以及数据在池化资源的灵动流转。

AI与软件定义进一步结合,“让合适的人干合适的事”,智算中心的AI计算效率将实现惊人提升。

AI是智算中心输出的主要计算力形态。当AI与软件定义结合后,将赋予了软件定义更高级的含义。

从业务上,实现了基于业务特征感知的智能资源调度,让合适的资源在合适的位置去执行合适的任务,就像一般人常说的让合适的人去干合适的事一样。

软件定义一个典型的趋势是软硬件协同设计,由专用芯片、FPGA处理更多的业务负载,由软件进行更智能化的管理和调度,这种趋势将为AI计算带来惊人的效率提升。例如,FPGA和NVMe组成资源池,以硬件辅助虚拟化的方式为虚拟机提供接近硬件性能的计算、存储、网络功能,性能损失从传统软件模拟方式的50%降低到1%左右,性价比提升25%-50%,百倍加速了AI作业效率。

“新基建”着眼于构架数字化、智慧化基础设施,推动中国社会经济的整体升级转型。当前人类社会处于智慧升级的转型期,计算力成为社会经济发展水平的重要指征,各国政府对于IT基础设施的投资不断增加,新型的计算力竞争已经开始。智算中心以社会智慧化需求为目标,基于最新的技术和产业生态,在新基建的背景下,将成为未来计算力的主要生产中心。

来源:业界供稿

0赞

好文章,需要你的鼓励

2020

04/10

10:49

分享

点赞

邮件订阅
白皮书