从封闭走向开源,同样适用于网络
软件定义未来世界,开源引领软件未来。越来越多的企业和组织积极参与开源生态建设。其实,开源不光定义软件,也在重构硬件。
比如开放计算的兴起,极大地加快了硬件创新的速度,推动了软件定义功能的集成以及效率的提升。
开源开放不但主导了计算的创新,在网络方面也是如此。开放网络包括开源软件与开源硬件,开源软件的代表为SONiC,开源硬件指的就是裸金属设备,开放网络的客户价值在于低成本、技术迭代快、灵活易拓展等等。
SONiC作为网络领域的Linux,成为开放网络主流的操作系统。据Gartner报告显示,到2025年,超过40%的大型数据中心企业会部署开放网络,开放网络即是网络未来。
浪潮信息网络研发部总经理李鹏翀在近日举行的2023年开放计算中国社区技术峰会(OCP China Day 2023)上接受记者采访时表示,数据中心的网络成本伴随着带宽的增长在不断提升,业界正在将开放计算的模式复制到网络领域。
从点到面,开放网络的行业破局
开放网络为企业提供了更多的灵活性和便利性。与此同时,开放网络有效地利用了软件和硬件的解耦,使系统组件在兼容性、互操作性和可扩展性方面得到极大提升,客户可以根据业务需求组建更加开放和灵活的网络方案,大幅降低组网成本。
众所周知,云厂商之间的竞争非常激烈,而竞争的核心是效率和成本,而分布式与虚拟化是关键。头部云服务商的数据中心基于开放计算技术构建,使客户摆脱供应商的锁定,加速云计算业务的创新。我们看到国外的头部互联网企业亚马逊,微软,以及国内的头部企业阿里、腾讯,都已经全面进行了开放网络的实施与部署。
浪潮信息网络研发部副总经理陈翔表示,云服务商对两点比较在意,第一个是价格敏感,降低成本;第二点创新驱动,业务的迭代速度非常快。
目前,开放网络的应用正在从CSP领域向通信领域拓展,在数据中心领域的价值已经得到验证,毕竟数据中心的业务逻辑是一样的,只是企业级数据中心的规模要小些。
开放网络作为行业大趋势是毫无疑问的,目前来讲,开放网络的市场份额前景广阔,未来随着开放网络向园区网市场渗透,其市场份额会显著增加。
场景拓展,开放网络加速创新
网络逐步转向软件定义和云原生构架,从传统软硬一体黑盒设备,发展到通过开放网络方案实现软硬解耦的新兴网络设备。除了数据中心以外,SONiC社区已经开始开发通信场景和企业级园区网场景。
比如通信现有集采的软硬件一体网络设备,技术演进依靠厂商实现,难以支撑快速迭代的业务需求,并且不同品牌的设备在同一个生产环境下难以有效对接,运维复杂且成本高昂。
开放网络功能可按需定制,让客户对自身大规模业务全链路可管;在运维方面,自研网络操作系统对网络设备进行统一纳管,有效提升运维效率;开放网络可提供低时延,无丢包的无损以太网络,充分释放高性能算力。
陈翔表示,SONiC把选择权交给用户,用户可以自由选择硬件和软件供应商,整个创新速度就会变得很快。
目前业界都在谈论大模型和AIGC,开放网络可以为人工智能快速构建超大吞吐、超大带宽、超低时延的无损网络。现在AIGC的网络基本上是IB网和以太网的RDMA。如果用户不能掌控组网的话,按照现在IB交付期可能达到6个月到1年时间,根本没法在竞争激烈行业里面率先把模型训练出来。
大模型本身在对算力提出高要求的同时,网络也必须跟上,这表现为两个方面:硬件创新需要特别迅速,同时为了充分发挥硬件性能,网络的流量拥塞算法和负载均衡、多路径选择都要做到最好,而且需要具备网卡、交换机、光模块等进行整体的端到端优化能力,才能给客户提供更好的网络服务。
端到端,浪潮信息的开放网络布局
作为开放网络引领者,浪潮信息参与OCP、ODCC、OCTC等开放工作组项目的开放网络标准制定,推动国内S3IP项目立项和持续发展,促进开放网络技术的发展。
浪潮信息基于SONiC研发UXOS的同时,也在积极回馈SONiC社区,促进开放社区的繁荣。在SONiC社区的硬件里,贡献了25G、100G交换机的平台及代码,在软件里,回馈了浪潮信息研发的网络特性,如GRE和MC-LAG等的特性增强等等。
在硬件方面,浪潮信息提供1G到400G的全系列开放网络产品,涵盖DCI路由器、高密ToR交换机、Spine-Leaf交换机、管理网交换机等主要网络设备,并打造了端到端RoCE、高性能无损以太解决方案。
目前,浪潮信息已协助互联网、通信等客户实现开放技术落地,构建以开放网络为核心的数据中心组网,覆盖通信、数据中心、AI超算、分布式存储和边缘计算等多种业务场景,满足不同客户需要。
展望未来,浪潮信息始终以“可靠、开放、智能”的核心理念,打造端到端开放网络整体解决方案,提供性能更高、延时更低和运维更智能的网络服务,使能客户开放网络转型,加速拥抱开放生态,进入技术创新的快车道。
好文章,需要你的鼓励
这项研究探索了语言神经元视角下多语言对齐如何增强大语言模型(LLMs)的多语言能力。研究团队提出了一种更精细的神经元识别算法,将激活神经元分为语言特定、语言相关和语言无关三类,克服了现有方法的局限性。基于这种分类,研究将LLMs多语言处理过程划分为四个阶段:多语言理解、共享语义空间推理、多语言输出空间转换和词汇空间输出。通过分析对齐前后不同类型神经元的变化,发现多语言对齐促进了更多语言相关神经元的共享使用,减少了对语言特定神经元的依赖,这也解释了"自发多语言对齐"现象。
这项由弗吉尼亚大学与Adobe研究院合作的研究突破了传统图像到视频生成的空间限制,提出了"Frame In-N-Out"技术,使物体可以自然地离开画面或新物体能够进入画面。研究团队创建了专门的数据集和评估方法,并设计了一种融合运动控制、身份参考和无边界画布的扩散变换器架构。实验结果表明,该方法在生成质量和控制精度上显著优于现有技术,为电影制作和创意内容创作提供了新可能。
浙江大学研究团队开发了首个评估视觉语言模型多视角空间定位能力的综合基准ViewSpatial-Bench,并揭示了现有模型在视角转换理解上的严重缺陷。通过自动化3D标注流水线构建的大规模数据集,他们训练出的多视角空间模型(MVSM)实现了46.24%的性能提升,为人机空间交互提供了新的解决方案,使AI系统能更好地理解人类视角下的空间关系,促进更直观的人机交流。
ByteDance团队提出的DetailFlow是一种创新的图像生成方法,通过"下一细节预测"策略实现从粗到细的自回归生成。它将图像编码为仅需128个令牌的1D序列,比传统方法少5倍,却实现了更高质量(2.96 gFID)和更快速度(提速约8倍)。该方法巧妙地模拟人类创作过程:先勾勒整体结构,再逐步添加细节,并通过自我纠错机制解决并行推理中的错误累积问题,为高分辨率图像生成提供了高效解决方案。