2018年10月10日,华为云携手Mellanox今日在华为全联接大会(HC)2018上,发布基于200Gb/s InfiniBand HDR网络的华为云高性能云计算解决方案,华为云也由此成为全球率先支持200Gb/s InfiniBand HDR高速网络的公有云厂家。
Mellanox是全球领先的数据中心高速网络解决方案提供商,在全球范围内为服务器和存储提供端到端InfiniBand和以太网互连解决方案。Mellanox提供网卡、交换机、高速线缆和光模块、软件和芯片,其高速智能网络解决方案可以极大的提升数据中心效率,在应用和应用之间快速的传递数据,从而提升应用的性能。
历经多年的深度合作,Mellanox端到端的网卡、交换机、光模块、线缆等产品现已应用于华为多个产品线,为华为IT基础设施和云计算提供性能业界领先的关键技术支撑。今天,华为云基于200Gb/s InfiniBand HDR网络的高性能云计算解决方案能够为高性能计算(HPC)、人工智能(AI)、云数据中心、金融实时交易等应用场景提供更强有力的性能保证。Mellanox的InfiniBand HDR网络技术除了可以提供高达200Gb/s的带宽和更低的端到端延时之外,更是集成了面向人工智能和高性能计算的网络计算功能,如RDMA(Remote Direct Memory Access)技术、SHARP(Scalable Hierarchical Aggregation and Reduction Protocol)技术、NVMe Over Fabric硬件卸载等;以及面向未来智能云计算中心的网络智能修复功能SHIELD(Self Healing Communication Technology)等先进的功能,可大幅提升云计算中心的整体性能,系统的健壮性和易管理性。
Mellanox InfiniBand HDR交换机,可以在1U的机架空间内拥有40个200Gb/s的交换端口,或者扩展成80个100Gb/s带宽的HDR100端口。此外,Mellanox还提供独特的“Y”型线缆和“H”型线缆,实现一分二(一个200Gb/s HDR端口分成两个100Gb/s HDR100端口)和二对二的功能(2个HDR100端口对应2个HDR100端口),可以帮助客户大大简化网络拓扑架构,减少数据中心成本。
在这次华为全联接大会(HC 2018)上,华为云和Mellanox共同展示了基于InfiniBand HDR的高性能云计算方案,包括弹性云服务器、裸金属服务器、异构计算加速服务器,以及存储并行文件系统等,全方位展现了完整的新型HPC云方案,将为需要高性能云服务的领域带来快速高效、开放安全、更高性价比的服务模式。
华为云大企业项目群总监马麟瑜先生表示:“Mellanox是华为重要的合作伙伴,此次联手发布基于InfiniBand HDR 200G/s的HPC云方案,将为客户提供更高性能的云服务,面向对性能需求日益增长的人工智能市场,高性能计算市场、存储市场等提供一流的产品。华为云也将继续致力于为客户提供卓越的性能和可靠性,并为客户提供更多样、更有竞争力的解决方案。”
Mellanox公司市场部副总裁Gilad Shainer先生表示:“在机器学习、HPC云日益发展的今天,客户们对于网络性能的要求达到了极致。Mellanox InfiniBand HDR 200Gb/s互连方案的高性能、网络计算能力和网络自修复能力,是未来智能云计算中心的关键技术。作为高性能计算(HPC)互连领域的领导者,我们很高兴与华为合作,共同构建前沿的HPC云平台,实现HPC应用在云端的交付,为用户提供面向未来的HPC解决方案。"
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
延世大学研究团队通过分析AI推理过程中的信息密度模式,发现成功的AI推理遵循特定规律:局部信息分布平稳但全局可以不均匀。这一发现颠覆了传统的均匀信息密度假说在AI领域的应用,为构建更可靠的AI推理系统提供了新思路,在数学竞赛等高难度任务中显著提升了AI的推理准确率。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
蒙特利尔大学团队发现让AI"分段思考"的革命性方法Delethink,通过模仿人类推理模式将长篇思考分解为固定长度块,仅保留关键信息摘要。1.5B小模型击败传统大模型,训练成本降至四分之一,计算复杂度从平方级降为线性级,能处理十万词汇超长推理,为高效AI推理开辟新道路。