2013年,亚马逊云服务宣布推出新的C3实例类型,并模糊地提及了通过英特尔虚拟功能接口实现的"增强网络"功能。
这家云计算巨头后来承认,"增强网络"是通过使用增强型网卡实现的,这些网卡具备足够的处理能力来运行防火墙和负载均衡器等工作负载,同时处理常规的数据包传输。
这种安排对AWS很有效,因为将防火墙转移到网卡上释放了一些服务器容量供云巨头出租。它还提高了网络流量速度,并通过为多租户工作负载提供隔离环境来运行网络功能,从而带来一些安全改进。
其他超大规模云服务商也创建了类似的卡片——后来被称为智能网卡或"数据处理单元"(DPU)。Mellanox也看好这个想法,并在2017年将其转化为名为"BlueField"的DPU产品,宣传其在全闪存存储区域网络中加速数据传输的理想性能。
到2019年,VMware注意到了智能网卡,并开始调整其旗舰虚拟化管理程序以在这些设备上运行,使其能够托管网络功能。英伟达也注意到了BlueField,并在2019年收购了Mellanox。
2021年,英特尔携自己的硬件加入这一领域,尽管它称之为"基础设施处理单元"而非智能网卡或DPU。AMD在一年后通过收购DPU制造商Pensando紧随其后。
同样在2022年,VMware发布了名为vSphere分布式服务引擎的产品,可以管理智能网卡和运行在其上的分布式防火墙。
此时,智能网卡获得了VMware、英特尔、AMD和英伟达的支持,这些公司都拥有大量数据中心客户,并推动DPU作为将客户网络带入光明新未来的部署就绪解决方案。
然而随后并没有太多进展。
VMware告诉The Register,分布式服务引擎并未受到客户青睐。分析公司Crehan最近发布的数据显示,租赁服务器容量的服务提供商仍然是DPU的主要客户,该公司"尚未看到在此市场之外的广泛渗透"。
Crehan还注意到"新的创新、用例和部署模型,如支持DPU的以太网交换机和CPU替代方案,这些应该会扩大客户群"。
思科是交换机中DPU的主要支持者,将其作为"Hypershield"安全产品和N9300智能交换机的核心。这验证了DPU的实用性,但不会推动大批量销售。
不过,蓬勃发展的AI领域可能会改变这一状况。分析公司Gartner最近发布了边缘AI和在Kubernetes上运行的参考架构。两个指南都建议使用DPU——英伟达在其AI云参考架构中也是如此建议。
就在几天前,另一个主要参与者红帽也支持DPU。IBM的开源部门悄然宣布在OpenShift 4.19中推出"OpenShift DPU操作器"的技术预览版。
红帽告诉我们,他们认为DPU可以运行虚拟交换机、负载均衡器或防火墙。
OpenShift产品管理高级经理兼红帽杰出工程师Ju Lim告诉The Register,DPU还可用于"通过直接NVMe管理优化数据库和分析工作负载"。
Lim认为这些卡片在AI领域也有作用。他建议:"AI驱动的推荐引擎可以在DPU上运行推理工作负载,同时将主机资源专用于持续模型重训练,最大化性能和资源效率。"
因此,AI革命可能最终带来DPU革命。这确实是2025年的典型结果。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。