为了满足AI、数据分析和高性能计算的飞速增长,数据中心正在迅速进化成为速度更快的、解耦的和软件定义的架构。
NVIDIA的网络事业部——Mellanox,正在通过对SONiC(Software for Open Networking in the Cloud,云端开源网络软件)的支持,来助推这一趋势。该开源网络操作系统基于Linux,能为超大规模数据中心提供厂商中立的网络连接。SONiC最初由Microsoft为Azure开发,现由OCP(Open Compute Project)管理,并已取得了其他云业务和企业用户的广泛关注。
SONiC针对大型数据中心的自动化与易扩展进行了优化,SONiC社区也得到了越来越多厂商和用户的支持。其开放性使得客户能够灵活地在各平台或供应商之间切换,而无需更改软件栈。,它的模块化、易扩展和容器化的设计,不但实现了快速功能更新,还能加速创新和降低成本。
我们在SONiC上投入巨大,是SONiC社区的前三大代码贡献者之一。用户已在运行SONiC操作系统的生产数据中心部署了11000多台的Mellanox交换机和35万多个Mellanox Spectrum交换机端口。Mellanox SONiC交换机的用户包括了全球主要的大型云平台和企业用户。
SONiC所具有的开放性和标准化的API(SAI——Switch Abstraction Interface),使用户可以根据其对网络需求来选择最佳的交换机芯片和交换机系统。Mellanox为SONiC提供了一流的硬件,可以在不中断业务的前提下进行软件升级、优化的RoCE(RDMA over Converged Ethernet)可加速GPUDirect和NVMe over Fabrics等应用,以及完全可编程的pipeline。端口共享缓冲能够为任意端口与端口速度的组合提供低延迟。我们先进的遥测解决方案,WJH(What Just Happened),完全支持SONiC,我们将在5月12至15日的OCP虚拟峰会上演示该解决方案。
Mellanox的Spectrum交换机支持SONiC和Cumulus等多种网络操作系统,并且为了便于连接到企业级Azure Stack和Azure云平台的虚拟化和裸金属数据中心的服务器,Microsoft Windows Server已经内置Mellanox ConnectX NIC的驱动程序。
Mellanox是首家为企业级SONiC提供完整的ASIC至Protocal(A2P)支持的网络供应商。 Mellanox将为预装其SONiC的用户提供相关的培训和A2P的全套支持。
SONiC的客户主要是一些云公司和企业用户,开源网络操作系统的灵活性对他们而言至关重要。请参看以下部分客户的评价及权威分析公司的观点:
微软Azure Networking副总裁Yousef Khalidi表示:“我们欢迎不断壮大的SONiC开源社区,包括广泛的服务提供者和交换机供应商等如Mellanox,对SONiC提供支持、贡献代码并已量产使用。SONiC是一个解耦式的开源网络操作系统。它能帮助数据中心加速创新、快速部署和实现大规模的网络自动化。它已成为Microsoft Azure基础架构的重要组成部分。”
总部位于上海的全球数据中心构建商UCloud,为客户提供各种云服务,充分利用了开源网络操作系统的优势。该公司网络总监Marcus Chen表示:“Mellanox一直以来都是开源以太网技术的先行者,而SONiC则是一个重要的里程碑。云运营商现在可以摆脱供应商的限制并通过构建定制化的基础架构来满足当前和快速发展的客户需求。”
行业分析公司IDC数据中心网络研究副总裁Brad Casemore表示:“ IDC已经通过一些全球大型IaaS云供应商对开源SONiC网络操作系统日益增长的采用率进行了密切追踪。现在,SONiC除了被应用超大规模数据中心之外,还被越来越多的2级云供应商、甚至一些大型企业所采用。Mellanox对SONiC的支持(包括达到35万个交换机端口的标准),为SONiC当前和潜在用户提供了进一步的保证,他们的解耦式数据中心网络将具有满足未来需求所必需的灵活性、性能和可扩展性。”
对于那些有意向尝试SONiC或其他开源以太网系统的用户,Mellanox为他们提供了多代的Mellanox Spectrum系列以太网交换机和各种网络软件解决方案,还可以为特定的使用Spectrum和SONiC的数据中心用户提供全套支持,这是其他任何以太网交换机供应商目前都无法提供的。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。