5月18日,第八届中国云计算大会于北京召开,中国工程院院士、浪潮集团执行总裁王恩东受邀出席并发表了“融合架构引领云计算数据中心”的主题演讲,指出全球正迎来以云计算、大数据、物联网等为依托的智慧计算时代,数据量的爆炸使得计算不断向后端转移,数据中心需要借助新技术完成融合架构的演进。
中国云计算大会由中国电子学会发起,是中国云计算产业最高级别的盛会。本届大会以“技术融合 应用创新”为主题,设立“VISION远见”、“PRACTICE实践”、“INNOVATION创新”和“FRONTIER前沿”四大议题,吸引了云计算大数据领域意见领袖以及车联网、人工智能、SaaS、中国制造2025等热点行业的产业界权威人士,以及数千名从业人员和用户参会。
智慧计算,“分而后合”的选择
“当应用数量以百万计、用户数量以十亿计、联网设备数量以千亿计逐渐成为现实,我们发现信息世界变得前所未有的庞大和复杂,需要一种更加智能化的新型计算方式。”王恩东表示,最初的数学计算演变为科学计算和商业计算两大分支,并在之后的70年中衍生出诸如高性能计算、数据库、关键计算、云计算、大数据、深度学习等众多计算类型。而随着云计算、大数据和深度学习的相互促进、相互融合、共同发展,催生了智慧计算这种新的计算类型。
对于智慧计算,王恩东的理解是“以云计算为平台、以大数据为基础、以深度学习为工具”。
计算重心向后端转移
王恩东认为,随着智慧计算的到来,数据量的爆炸将使得计算不断向后端转移。他指出,“今后智能前端设备会越来越多,也越来越轻量,甚至一个扣子就有可能成为智能设备,前端计算将朝着便携化、轻量化和泛在化发展。而通过物联网,这些设备可以将各种各样的数据持续不断的向后端传输,带来数据更进一步的爆发增长,并且数据来源多样性、格式的复杂性和语义的不确定性,都将导致后端计算量越来越大,促使数据中心向着集中化、规模化发展。”
数据显示,单一数据中心规模持续增长,预计到2020年将出现50万台容量的单一数据中心。同时,大规模数据中心越来越集中,预计到2020年5000台以上的数据中心服务器的数量将达到整个服务器保有量的70%。
数据中心面临三大挑战
如同500人和50万人的公司管理难度不可同日而语一样,数据中心的集中化、规模化也必然会带来众多新问题和挑战。对此,王恩东认为,当前数据中心主要面临性能、效率和能耗的三大挑战,迫切需要一种新型架构提升数据中心的能效。
在性能上,由于当前普遍采取冯诺依曼架构将计算和存储分离,而CPU的处理速度和数据的存取速度之间不匹配,造成内存墙、IO墙,使得数据存取问题成为目前提升计算速度的第一大难题。同时,随着集成电路工艺发展遇到瓶颈,曾指导IT发展的摩尔定律或将走向终结。此外,目前的数据中心普遍采用分布式架构,设备间的互连网络带宽远低于板内和设备内的互连带宽,并且网络协议复杂、层次众多,协议的转换和处理占用了大量系统资源,使得业务系统扩展性受到严重限制,数据中心面临网络性能瓶颈。
而在效率上,虽然通过虚拟化能够实现计算资源在不同业务间的动态调度,从而使得单一设备的利用率提升,但整体的资源利用率不高。“我们有两个手机号,每个都有通话时间、短信、流量套餐,一个光打电话,短信流量没用;一个光发短信上网,不打电话,总体上是很浪费的。”对于整体效率的低下,王恩东用这样一个形象的例子做了说明。此外,导致效率低下的第二个原因是通用器件与应用需求之间的匹配性差,如通用处理器采用通用的迭代电路设计,与GPU、DSP等专用芯片相比,在执行特定算法时性能相差100~1000倍。
在能耗方面,有数据显示2015中国数据中心的年耗电相当于三峡大坝的全年发电量。而全球数据中心的用电量相当于30座大型核电站的发电量。目前,数据中心散热开支已占总电费的50-60%,虽然有很多技术可以将数据中心的PUE值从2.0降到1.5甚至更低,但非IT能耗依然突出,使得数据中心运行成本高昂。
发展融合架构要聚焦四大关键技术
一个显而易见的事实是,传统的数据中心和原有计算模式已无法满足业务快速发展的需要,计算、存储和网络设备之间的关系需要被打破并重新定义,需要在新技术的基础上完成架构变革。王恩东强调,智慧计算时代的数据中心将向融合架构演进,在硬件层将计算、存储、网络等各种设备中的同类资源整合为资源池,不同设备之间的同类资源能够任意重组,在软件层动态感知业务的资源需求,利用硬件重组的能力,智能的动态分配和组合资源,满足各类应用的需求。
对于融合架构的发展,王恩东认为应该大力发展高速互连技术、新型存储与内存计算、可重构技术和软件定义四个方面的关键技术,最终实现硬件重构与软件定义的完全融合。其中,基于硅光的高带宽、低延迟互连技术将为融合数据中心硬件重构提供关键支撑,而非易失性存储器性能与容量密度的突破性进展,将对计算机系统的传统存储层次结构产生革命性影响。
随着更多软硬件新技术的应用,王恩东认为未来数据中心最终会实现CPU、内存等所有的硬件资源的全解耦、全池化,硬件可任意组合并根据应用需求智能地分配和组合相关资源,实现真正意义上的“数据中心即计算机”。
另据了解,在大会期间浪潮展示了两款最新的融合架构2.0产品——SmartRack4.0整机柜服务器和InCloudRack云一体机,前者面向大规模数据中心设计,以整机柜为设计对象,将节点内的电源、风扇和管理模块统一集中为机柜供电模块、风扇墙和管理模块,相比传统服务器,机柜的空间利用率从81%提升到90%,部署密度最高可提升2倍,部署速度可提供10倍以上;后者面向企业私有云设计,以一体化网络引擎UNE构建了分布式网络,并通过软件定义的方式实现了柜内计算、存储和网络资源的集中池化、统一调度和统一管理。
在王恩东看来,2016年将是浪潮“计算+”的深化之年,浪潮将增加面向智慧计算的投资,全力发展融合架构2.0和生态2.0,加快硬件重构与软件定义的深度融合,促进云计算生态的建设,构建未来核心竞争力。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。