11月13日,开放计算中国社区技术峰会(第二届OCP China Day)在北京举行,超过600多名IT工程师和数据中心从业者参加了此次大会,来自Facebook、Intel、微软、浪潮、百度、腾讯、阿里、NVIDIA、诺基亚、中国移动、希捷、燧原科技等开放社区成员参与了峰会,分享了在开放计算技术的最新进展和创新实践。
5G和AI等新技术的普遍应用和快速发展,给数据中心带来更多新兴场景。在OCP开放计算社区,面向AI加速器芯片统一的OAI、面向5G边缘计算场景的OpenEdge和开放网络标准的SONiC正在成为新一波开放计算产业化发展的重点方向,这些技术正在OCP(Open Compute Project,开放计算项目)社区得到积极的响应。经过近十年的发展,OCP社区的研究领域也由最初聚焦数据中心基础设施,逐渐向5G、边缘计算、AI等前瞻技术融合、新兴应用场景扩展。目前,OCP社区成员已超过200家,包含数据中心基础设施、服务器、存储、硬件管理、开放加速硬件等8个技术项目组,OCP China Day也已成为全球开放计算最具规模的生态峰会之一。
ALL in ONE,整机柜交付模式成为新常态
当前,在线经济驱动下的超大规模数据中心快速发展,快速部署、智能运维、灵活扩展的整机柜交付模式已经成为了超大规模数据中心建设的新常态。Open Rack、天蝎、Open19作为主流的整机柜开放技术标准,已经被大型数据中心迅速接受,不仅因为密度高、易维护,投资回报高,也因为快速部署,高效提升数据中心的物理弹性。
2019年,浪潮在百度数据中心交付的L11级标准天蝎整机柜,实现了8小时1万余节点交付的业界最高纪录,交付效率提升10倍。
伴随数据中心规模化、集中化趋势,数据中心对IT设施管理,设备的快速配置、远程故障定位及自动化、智能化运维提出更高要求,为此OCP社区专门设立数据中心自动化运维套件技术项目。据了解,OpenRMC工作组已经启动OpenRMC代码框架I9000硬件验证,并计划在2021年第四季度发布OpenRMC 3.0。
OAI开放模式助推AI技术产业化创新
OCP让AI计算融入下一代数据中心的同时,其发展的OAI开放标准极大刺激了AI计算基础设施的融合创新。目前OCP社区OAI(Open Accelerator Infrastructure)小组推进的开放技术规范涉及OAI、OAM、UBB、HIB等9大领域,涵盖结构设计、温度、管理、供电、硬件安全性、可用性等诸多方面,旨在建立一整套可兼容各类AI加速器的技术标准,解决AI计算基础设施建设中硬件分裂化和生态割裂化的重大挑战。
目前,百度、Facebook、微软、浪潮等企业均为该OAI小组成员。今年浪潮联合主流OAM成员厂商Intel Habana、燧原科技和寒武纪实现了在浪潮OAI系统上的适配。基于OAM标准,浪潮制定了UBB SPEC的设计规范,大幅提升各类符合OAM规范的AI加速芯片的兼容性。目前,百度的X-MAN4.0、浪潮的MX-1、燧原科技的T11等一系列产品已支持OAM标准。
开放边缘计算已经开启规模化应用
5G、AI的发展,在催生了数据中心规模化发展的同时,更激活边缘计算应用场景的多元化需求。OCP和ODCC不约而同的在边缘计算积极推动,分别设立了OpenEdge和OTII项目组。其中,OpenEdge作为OCP社区的重要项目组,制定了全球第一款通用的边缘服务器标准,解决了边缘服务器规范与电信规范融合的基础问题。2017年11月,中国移动联合中国电信、中国联通、信通院和Intel公司等发起OTII项目,已有39家成员单位,于2019年做出了第一款产品,并实现了大规模应用。
据悉,中国移动已有105个边缘试点项目,部署了200多个行业应用。2020年中国移动、中国联通基于OTII服务器进行了UPF测试及边缘试点。接下来,中国移动还将继续完善OpenUPF等解决方案,与产业链开展5G和边缘计算的合作。
浪潮作为OTII和OpenEdge的共同成员,也在边缘计算领域积极布局,已经研制了边缘微数据中心、边缘云服务器、边缘AI服务器、智算小站等多种边缘计算方案,在矿山、石油、工业互联网、智慧城市等多个领域实现应用。
SONiC,解放数据中心网络
为满足AI、数据分析和高性能计算的飞速增长,数据中心加速向软件定义基础架构的进化,其中数据中心网络传输层需要更加智能化、自动化、高性能、高可靠且极具弹性,SONiC(Software for Open Networking in the Cloud)因此油然而生。
SONiC作为OCP OPEN NETWORK 项目组的子项目,在过去六个月,已交付了约 15个新的功能集。其中包括用于容器和主机通信的D-BUS、动态端口拆分、端口镜像等功能。
该团队还计划在未来六个月内交付约35个新功能和增强功能。
NVIDIA作为SONiC社区的前三大代码贡献者之一,通过SONiC解决了Spectrum交换机网络故障诊断和故障排除的准确性和效率问题。浪潮也积极参于SONiC社区,针对社区版本进行了大量的测试、安全加固和应用场景实践,支持弹性的SPINE-LEAF网络架构,相对传统的3层网络架构,可靠性更高。而腾讯通过“凤凰项目”自研的NOS继承了SONiC的主要架构优点,相比传统交换机使用的嵌入式系统专用内核,其成熟的工具和良好的生态,给交换机的开发和维护工作带来了很多的便利。
未来,SONiC社区将会给业界呈现更多、更便捷的新功能,如支持400G网络、Chassis场景、Kubernetes管理、高速RDMA和安全模块等等。开放融合,开放计算正在改变IT产业。
随着开源软件和开放硬件的不断融合,开放开源技术正在深刻改变全球IT产业分工协作模式。OCP作为全球最大的开放计算社区,集合全球最领先企业,以社区的方式加速领先技术的产品化和产业化,加速数据中心的进化,并促进前沿技术从超大规模数据中心向传统数据中心的渗透,带动整个产业的发展和进步。
好文章,需要你的鼓励
开放闪存平台(OFP)旨在用直接访问的闪存盒替代全闪存阵列,每个闪存盒配备控制器DPU、Linux系统和并行NFS软件。该倡议由Hammerspace主导,针对新云、超大规模和AI公司在数据中心设计演进中面临的基础设施限制。OFP通过结合IPU/DPU技术、闪存优化机箱和Linux协议,提供高密度、低功耗的存储解决方案,满足AI应用从PB级向EB级数据容量需求的扩展。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
ERP系统市场近年来相对稳定,但AI正在改变一切。供应商们正竞相在产品组合中嵌入AI功能,构建包括可组合应用、集中数据存储和可扩展云平台的生态系统。Oracle凭借AI投资超越SAP成为ERP收入领导者,而AI代理已从实验阶段进入实际应用,能够管理整个工作流程并进行自动化决策。本文盘点了Oracle、SAP、微软等十大最具影响力的ERP厂商及其AI战略。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。