8月10日,由OCP社区主办、浪潮信息承办的OCP China Day 2022(开放计算中国技术峰会)在北京举行。在“开放计算创新论坛”上,来自Intel、三星、浪潮信息、安谋科技、希捷、Credo、阿里云、燧原科技的嘉宾分享了计算架构、芯片、AI、边缘计算、高速互联等领域的新技术、新趋势、新观点,展示了开放计算的创新成果。
加速多元算力创新
算力作为数字经济发展的核心生产力,已成为国民经济发展的重要基础设施,以多元的异构算力资源,与涵盖芯片、平台、软件、封装制程以及大规模制造的综合优势推动行业共同创新。
面对算力新时代日益多元的数字化创新需求,英特尔始终致力于通过四大超级技术力量——无所不在的计算、从云到边缘的基础设施、无处不在的连接和人工智能驱动行业创新与数智转型。
Intel人工智能架构师赵玉萍在《共筑生态,芯起未来 - 英特尔新基建助力AI新战略》主题演讲中表示,基于XPU战略,英特尔打造了跨CPU、GPU、FPGA、IPU架构的多种算力资源,同时以oneAPI实现软硬协同,推动异构计算的发展,为多元化的业务和应用场景需求提供定制化的算力服务。
在移动处理器市场,Arm具有强大的影响力,并积极拓展数据中心市场。Neoverse是Arm于2018年推出的针对基础设施领域的全新品牌和平台,可以面向云服务、边缘运算、高性能计算及5G基站等应用提供解决方案。
安谋科技市场总监钱电生在《Arm Neoverse架构、路线图及应用》演讲中表示,Arm架构先天的低功耗优势,加上针对基础设施市场专门推出的Neoverse平台,其高性能、高度灵活性等特性,能最大程度地满足各企业的个性化需求,带来优异的性能功耗比和性价比。
基于Arm架构的服务器已经越来越多地出现在各个主流公有云厂商提供的服务中,其中,通过使用Arm Neoverse平台来设计自己服务器的CPU,AWS是云中Arm的早期采用者。AWS通过其Graviton2的实例M6g、C6g及R6g,和上一代实例相比,为用户带来40%的性价比提升。
随着业界对算力需求的不断提高,越来越多的计算平台开始引入CPU、GPU、ASIC、FPGA等多种不同计算单元来进行加速计算,由此,异构计算应运而生。异构计算的核心点在于“异构”二字,说白了就是用不同制程架构、不同指令集、不同功能的硬件组合起来提高算力水平。
阿里云高级技术专家王名发在《vODLA异构计算资源池化技术的架构和实践》演讲中表示,异构计算(Heterogeneous Computing)是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式,目前主要包括GPU云服务器、FPGA云服务器和弹性加速计算实例EAIS等。异构计算能够让最适合的专用硬件去服务最适合的业务场景,在特定场景下,异构计算产品比普通的云服务器高出一个甚至更多数量级的性价比和效率。异构计算是均衡性能、成本和功耗的技术,从而实现性能和成本的最优化。
随着以深度学习为代表的人工智能技术的飞速发展,AI计算模型越来越复杂和精确,人们对于算力和性能的需求也大幅度增加,因此,越来越多的AI计算都采用异构计算来实现性能加速。阿里云异构计算云服务研发了云端AI加速器,通过统一的框架同时支持了TensorFlow、PyTorch、MXNet和Caffe四种主流AI计算框架的性能加速,并且针对以太网和异构加速器本身进行了深入的性能优化。
在人工智能、5G等技术的驱动下,边缘场景日益丰富,用户需要更灵活、更容易部署的解决方案以应对边缘侧持续增长的工作负载。
浪潮信息边缘服务器产品线高级经理刘香男在《边缘计算的发展与实践》演讲中表示,浪潮信息在边缘计算领域拥有阵容强大、形态丰富的产品体系,其产品在制造、交通、能源等多个行业边缘场景中更是有着广泛的应用。
例如浪潮信息与开放计算组织共同制定边缘服务器设计标准OTII,发布业界首款基于OTII标准的边缘服务器NE5260M5。
与此同时,为应对制造、交通等更多边缘场景更为严苛的环境、更多元的计算需求,浪潮信息定义了全新的边缘计算模块化设计ECOM技术规范。
随着边缘计算的快速发展,浪潮信息会不断研发更加适应于边缘各类环境的相关产品,为边缘计算技术的发展与应用作出更多贡献。
开放式创新带来的存储解决方案
预计到2025年,全球数据量将超越180ZB,在这样的趋势下,支撑数据中心运营的基础设施同样需要革新进化。
三星电子西安研究所存储解决方案部技术总监何兴在《开放创新的三星Poseidon系统》演讲中表示,波塞冬项目以跨行业合作为起点,开发了基于开源的、支持NVMe-oF的软硬件一体服务器解决方案。
三星与浪潮信息强强联合,开发了两代波塞冬服务器,最新的波塞冬V2可以支持DDR5, PCIe 5.0最新的协议标准并可搭载三星最前沿的产品如PCIe 5.0 SSD, SmartSSD, ZNS SSD和CXL Memory Expander, 为用户提供了极致的存储体验。
围绕新标准、新接口、新形态的数字中心存储趋势,三星将持续研发硬件与软件技术,为数据中心提供更大容量、更高性能和更高效的存储系统。
IDC预测,2026年全球数据圈将达到221ZB,2022至2026年将实现2倍增长。海量数据是数字经济发展的基本要素,规模化、集约化和绿色化将成为未来数据中心发展的关键词。
希捷科技中国区产品线管理总监刘嘉在《机械硬盘重生技术,助力云和企业进一步实现 “双碳”和ESG战略》中表示,希捷与生态伙伴携手创新,与全球领先的数据中心生态伙伴一起建设更加绿色节能的数据中心。希捷计划到2030年,生产和研发100%使用可再生能源,2040年实现碳中和。
通过可靠的硬盘数据擦除技术,希捷守护硬盘生命周期的同时还能保障客户数据的安全。希捷与国际标准化组织(ISO)等机构合作,执行统一的介质清理标准,在此基础上还推出了认证擦除,以环保经济且安全快捷的方式助力实现硬盘重生。
目前,希捷已经携手浪潮信息、联想、戴尔、谷歌等行业领先合作伙伴,通过硬盘产品以及相关部件的回收和循环利用,降低对环境的压力,创建可持续发展的数据圈。
高速互联助力算力和数据流转
除了算力、存储,网络的革新也是当前业界的热点。Credo独特的紫色HiWire™ 有源电缆(AEC)是一种即插即用铜互连电缆,设计用于在100G、200G、400G和800G速度下的经济、无损运行。AEC配有内置重定时器、变速箱、PCS和FEC。AEC为数据中心和电信应用提供了高性能的方案,代替短、粗DAC和高功耗、高成本AOC。
Credo产品副总裁Don Barnetson在《高速互联的未来与DAC的消亡》演讲中表示:DAC时代即将成为数据中心的历史,并解释了如今部署单通道112G线缆时,“DAC 税”的含义:如果在112G节点,仍保持让所有端口支持DAC,那将会付出更高的代价。这主要体现在以下三个方面:为支持DAC端口而采用LR(长距)SerDes所带来的功耗增加;为了减少插损而选择最先进的Megtron材料所带来的PCB成本负担;以及为支持DAC而设计支持AN/LT交换机所耗费的大量精力和时间。因此,AEC成为了未来数据中心短距离高速连接的理想选择。当传输速率达到400Gbps及以上时,AEC可以提供更高的信号完整性,并突破了DAC因重量、弯曲半径和可用长度等因素带来的使用限制。此外相较于AOC,AEC功耗更低,且降低了400G及以上终端用户在使用高性能连接线缆使用时终端用户面临的经济门槛。
发展绿色数据中心,打造高能效的先进算力,以及系统级的能效优化,是行业普遍的共识。随着以AI芯片为代表的算力侧的创新,产品能力往泛化支持、能效突出、生态友好等方面持续迭代;随着以DPU等方案为代表的网络通信侧的变革,系统架构从以任务调度为核心往以数据处理为核心持续迭代;随着OAM、OAI等技术的发展,开放计算体系在系统能力、标准化、生态化等方面持续演进;冷板式液冷、浸没式液冷等系统级散热方案的落地,有效推动高能耗的数据中心的高质量发展与演进。
燧原科技首席芯片和系统验证工程师俞武在《UBB和OAM高速IO物理层测试解决方案的探索与实践》演讲中表示,在UBB和OAM定义的SerDes链路有非常多的的高速信号,如何及时有效的评估链路拓扑和性能,以及出现问题后如何快速debug,是一个比较有挑战性的问题。燧原探索研发了一套测试夹具及相应的测试解放方案,主要包含了3种测试Fixture:OFA、OFB和OFP。这套方案已在浪潮服务器NF549A5上经过实测验证,解决了高速SerDes链路相关问题,为液冷千卡集群落地提供了保障。
结语
随着数字经济的蓬勃发展,以5G、AI为代表的新技术将增强新一代数字经济基础建设的能力,促进传统行业数字化、智慧化转型。
进入智慧时代,通过开源计算架构的不断发展,围绕芯片、异构计算、边缘计算以及高速互联等帮助企业降低整体成本、节能增效。
作为开放计算领域生态覆盖最广且最具影响力的亚洲最大年度技术峰会,OCP China Day迄今已成功举办4届。开放计算正成为当前乃至未来数据中心的创新主力,不断打破数据中心创新的边界,使得更多的技术得以融合。
未来,围绕开放计算所展开的全球协作与共同创新,将推动更多数据中心的领先技术普适化,解决碳排放、循环经济等世界性问题。
好文章,需要你的鼓励
临近年底,苹果公布了2024年App Store热门应用和游戏榜单,Temu再次成为美国下载量最多的免费应用。
云基础设施市场现在已经非常庞大,很难再有大的变化。但是,因为人们可以轻松地关闭服务器、存储和网络——就像开启它们那样,预测全球云基础设施开支可能非常困难。