生成式AI对各行各业正在产生深远影响,比如电信行业。随着生成式AI日益进入商业和消费者的生活方式中,以合适的成本构建合适的基础设施是网络运营商面临的最大挑战之一。

为了更好地拥抱生成式AI,运营商需要构建基础设施,而面对生成式AI,运营商需要改变已有数据中心,成为面向AI和5G的数据中心。
对加速计算和生成式AI的需求正在推动数据中心架构的根本性变革。软银正在创建一个互连的数据中心网络,用于共享资源并托管一系列生成式AI应用。相比以往的数据中心,这些新数据中心需要能够同时处理AI和5G工作负载。

通过与NVIDIA合作,软银使用全新NVIDIA MGX参考架构和基于Arm Neoverse的GH200超级芯片托管生成式AI和无线应用的数据中心,在生成式AI和5G应用之间动态分配GPU资源,以降低成本和更节能。
其中NVIDIA MGX以一个为加速计算优化的服务器机箱作为基础系统架构入手,GPU、DPU和CPU可以自由组合。AI训练和5G等多种任务可以在一台机器上处理,而且可以轻松地升级到未来多代硬件。MGX还可以轻松集成到云和企业数据中心。
这些特质显然对运营商具有巨大的吸引力,一方面他们可以拥抱AI,同时又可以优化已有基础设施,实现降本增效。
NVIDIA技术正在塑造未来5G、 6G无线和视频通信。
当前运营商正在拥抱RAN,特别是开放式vRAN,而NVIDIA也在强化对vRAN的支持,让运营商在开放与性能表现取得兼顾。

NVIDIA Grace Hopper和NVIDIA BlueField-3 DPU将加速软件定义的5G vRAN以及生成式AI应用,而无需定制硬件加速器或专用5G CPU。

此外,配备BlueField-3的NVIDIA Spectrum以太网交换机将为5G提供高精度时间同步协议。

该解决方案在NVIDIA加速的1U MGX服务器设计上实现了突破性的5G速度,根据公开的5G加速器数据,它实现了业内吞吐量最高的36Gbps下行链路容量。

NVIDIA Aerial是一个应用程序框架,实现了5G无线局域网(RAN)的GPU加速信号和数据处理。通过将NVIDIA Aerial软件引入到高性能的软件定义的云原生5G网络中,这些5G基站将允许运营商动态地分配计算资源,并实现比竞品高2.5倍的能效。
结语
对于处于转型中的运营商而言,他们希望能够抓住5G和生成式AI带来的市场机遇,而NVIDIA推动以加速计算和AI为标志的计算革新,帮助运营商构建一个强有力的基础设施,驱动自身的业务创新。
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。