至顶网服务器频道 06月26日 新闻消息(文/李祥敬):根据Synergy Research数据,2018年全球超大规模数据中心为430个,可容纳的服务器总量相当于全球服务器年销量的3倍以上,这些数据中心的拥有者是微软等超大规模互联网运营商。同时,部署在大型云数据中心的服务器出货量呈现快速增长。IDC的数据显示,云数据中心中的服务器数量现已占到全球服务器部署总量的15%以上。
面对如此变化的市场,OCP开放计算社区以开放开源的形式,将最领先的数据中心实现标准化、产业化,从而加快整个行业的变革进程。OCP开放计算社区于成员企业约有200家,其中包括英特尔、谷歌、微软、Facebook、LinkedIn以及阿里巴巴、百度、腾讯、浪潮等,囊括了全球TOP级互联网运营商,数据中心不同产业环节最领先的厂商等。OCP社区成员不仅进行着最领先的数据中心创新实践,也主导着数据中心以及基础架构的技术创新以及市场采购。
2019年6月25日,由浪潮与OCP联合主办的OCP China Day(开放计算中国日)在北京举行,大会聚焦Open Rack、OpenRMC、SONiC、人工智能、边缘计算等前沿技术话题,邀请到众多技术专家,与参展观众面对面分享开放计算领域的最新进展。此外,还有600平米的展区将展示各类成熟的OCP产品和方案。
OCP CTO Bill Carter在大会上表示,OCP是一个开放的社区,依靠合作伙伴协作创新。中国是快速增长的市场,OCP希望与更多的企业一起突破传统数据中心的界限,扩展到边缘,共同打造一个开源数据中心生态系统。
浪潮高级技术总监郭洪昌表示,未来是开放计算的时代,应用要避免信息孤岛,避免资源孤立。所以浪潮技术和产品的架构是开放的,浪潮与ODCC、OCP社区规范的融合越来越好,我们希望能够推动一个全球统一的开放计算生态。
浪潮一直在积极参与OCP的各项活动,牵头成立了OpenRMC技术小组,而且浪潮与英特尔联合向OCP社区提交了一项2U4路服务器全球参考设计Crane Mountain(浪潮服务器NF8260M5),该方案相比传统的2路服务器能够减少跨节点通信,在单位空间内可以部署更多的虚拟机。
经过8年时间发展,OCP开放计算社区现在已经是全球最大硬件开源社区之一,拥有数据中心基础设施、服务器、存储、硬件管理等10个技术项目组,并制定了不同领域的众多开放标准,OCS、Open Rack等开放标准在业内有着广泛的影响力。在OCP China Day 2019上,Open Rack、Open Firmware、OpenRMC等项目的重要更新也被一一展示。
Open Rack是OCP社区最具有影响力的标准项目,当前的OpenRack2.0已经被众多的互联网企业和电信运营商企业所采用,帮助这些用户解决了部署密度、能效等一系列具体的技术挑战,优化了整体投资回报。但是OpenRack2.0在进一步提高性能密度时,遇到了根本性的物理条件的限制,难以适应AI等新业务的需求。
所以,OCP开发了OpenRack3.0,这版本支持了48V供电、水冷散热,并将高度从41OU增加到44OU,调整了内部结构,适应了新的业务需求。Facebook、LinkedIn、百度、浪潮等将带来三大开放计算组织在整机柜技术的设计特点。
此外,OCP正在构建下一代数据中心管理架构,社区的Open Firmware项目组的宗旨是发展敏捷、开放、标准的固件设计规范来适应新一代云计算基础架构发展需求。项目组正在开发开源套件,这些套件仅包括最基本的平台代码来识别白盒硬件,同时用Intel FSP发展可构建和引导的白盒硬件系统,形成软硬一体化的Open Firmware生态。
社区的另一个项目组OpenRMC,正在致力于OpenBMC与Redfish的融合,形成下一代数据中心管理的统一框架,该项目由浪潮牵头成立。OpenBMC是Linux社区项目,意在解决闭源的BMC以及相关的软件包标准不一的问题。Redfish是替代IPMI的下一代数据中心管理规范。OpenRMC项目希望能够解决两个标准之间的互操作性等一系列问题,并建立协同机制,形成规范,推进下一代数据中心管理技术和产业的发展。
OpenRMC与Open Firmware将为下一代数据中心构筑起开放、标准、灵活的统一管理技术生态。
当前计算在变革,网络等也在革新。在网络全面云化的趋势下,数据中心必须全面云化。数据中心需要是软件定义的,模块化、开放以及标准化。SONiC是微软发布的开源交换机操作系统,是一个成熟的SDN软件平台,实现了数据控制面与转发面的分离,用户可以采购白牌交换机搭载SONiC实现不同的网络功能,SONiC使得用户能够更快的调试、修复并测试软件,通过改变软件策略和拓扑实现新的网络架构,让网络实践更为灵活。
阿里巴巴集团专家刘永锋表示,SONiC是基于Linux的开源交换机操作系统,也采用了OCP的开源项目,阿里巴巴的网络连接数十万服务器,数百万虚拟机和数千万终端,通过SONiC的大规模部署实现了高带宽和低延迟,而且阿里巴巴基于SONiC做了大量的个性化开发,这些工作很好地推动了阿里巴巴的业务创新。
数据中心变革的直接动力是大型化和现代化,而新兴的业务需求,如云、大数据和AI也在驱动数据中心的变革。云计算、海量数据、人工智能的兴起,这些都对数据中心提出了更高的要求。比如数据规模的不断增大,会促使数据中心向以存储和分析数据为中心的模式转变。而这无疑也对数据中心的扩展性、可用性等提出新的要求。
在OCP China Day 2019上,Facebook、百度等项目成员带来了OAM的最新进展。OCP社区在服务器项目组下设立了OAI(Open Accelerator Infrastructure)小组,负责开发OAM(OCP Accelerator Module)规范,将加速器模块标准化,简化AI基础架构的设计,缩短硬件设计周期。百度系统部副总监张家军表示,今年百度重新回到OCP,推动人工智能芯片标准化,帮助客户更好地利用芯片技术,同时加速行业发展。希望大家可以多关注OCP相关标准。
腾讯和浪潮在大会上宣布将T-Flex2.0规范贡献给OCP社区,该规范并不仅着眼于异构加速的规范设计,而是基于I/O池化技术,通过服务器不同模块的解耦重组,实现服务器的模块化迭代和灵活组合,用户可以基于该规范,可以实现异构加速、冷存储、HPC集群等各类不同的应用方案。
有数据显示,到2023年全球将有超过350亿台终端接入网络。伴随着5G的到来,5G的应用将给数据中心带来新的发展契机,也会对现有技术带来挑战。一方面更大规模的连接以及海量数据将推动云数据中心规模和设备密度的进一步加剧,另一方面,AI、视频等新兴应用普及很快,数据中心负载越来越多样和复杂,硬件在提高密度的同时还需要具备更大的灵活性。
另一方面,边缘计算成为业界关注的焦点,各类边缘数据中心将大量出现,与大规模云数据中心一起成为重要社会基础设施。如何发展边缘计算,以及满足边缘计算的需求成为产业亟需解决的问题。
5G时代,运营商将在靠近用户的网络边缘侧构建业务平台,将部分关键业务应用下沉到网络边缘,以减少网络传输和多级转发带来的带宽与延时损耗。OCP社区在电信项目组设立了Open Edge技术小组,希望为边缘计算服务器等硬件设施开发一套公开标准。
腾讯专家工程师蔡克文表示,腾讯云的目标是拥抱产业互联网,以开放的形式拥抱产业、行业、开源。这也是腾讯云积极参与OCP这样一个全球性开源组织的原动力。“我相信未来腾讯和OCP一起在边缘计算这块还会有很多有趣的项目展开合作,共同推进边缘计算整个硬件生态的发展。”
OCP China Day 2019涉及的话题非常广阔,从OCP整机柜架构、OAI、OCP开放边缘计算、OCP软件等,OCP的理念就是在大量的实践中总结出最佳实践方案,并将这些最佳实践方案标准化、通用化,推广到整个数据中心行业。
OCP社区的内容是完全开放透明的,成员贡献的IP可以被公开下载,各项标准在开发和制定过程也是完全公开的,而且形成的各项技术标准并不是具备强制性,因而,OCP的影响力来自社区的高度的专业性和技术领先性。通过OCP China Day 2019,我们看到开放计算产业蓬勃发展,OCP成员不断创新实践,推动数据中心产业的发展。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。