2013年,亚马逊云服务宣布推出新的C3实例类型,并模糊地提及了通过英特尔虚拟功能接口实现的"增强网络"功能。
这家云计算巨头后来承认,"增强网络"是通过使用增强型网卡实现的,这些网卡具备足够的处理能力来运行防火墙和负载均衡器等工作负载,同时处理常规的数据包传输。
这种安排对AWS很有效,因为将防火墙转移到网卡上释放了一些服务器容量供云巨头出租。它还提高了网络流量速度,并通过为多租户工作负载提供隔离环境来运行网络功能,从而带来一些安全改进。
其他超大规模云服务商也创建了类似的卡片——后来被称为智能网卡或"数据处理单元"(DPU)。Mellanox也看好这个想法,并在2017年将其转化为名为"BlueField"的DPU产品,宣传其在全闪存存储区域网络中加速数据传输的理想性能。
到2019年,VMware注意到了智能网卡,并开始调整其旗舰虚拟化管理程序以在这些设备上运行,使其能够托管网络功能。英伟达也注意到了BlueField,并在2019年收购了Mellanox。
2021年,英特尔携自己的硬件加入这一领域,尽管它称之为"基础设施处理单元"而非智能网卡或DPU。AMD在一年后通过收购DPU制造商Pensando紧随其后。
同样在2022年,VMware发布了名为vSphere分布式服务引擎的产品,可以管理智能网卡和运行在其上的分布式防火墙。
此时,智能网卡获得了VMware、英特尔、AMD和英伟达的支持,这些公司都拥有大量数据中心客户,并推动DPU作为将客户网络带入光明新未来的部署就绪解决方案。
然而随后并没有太多进展。
VMware告诉The Register,分布式服务引擎并未受到客户青睐。分析公司Crehan最近发布的数据显示,租赁服务器容量的服务提供商仍然是DPU的主要客户,该公司"尚未看到在此市场之外的广泛渗透"。
Crehan还注意到"新的创新、用例和部署模型,如支持DPU的以太网交换机和CPU替代方案,这些应该会扩大客户群"。
思科是交换机中DPU的主要支持者,将其作为"Hypershield"安全产品和N9300智能交换机的核心。这验证了DPU的实用性,但不会推动大批量销售。
不过,蓬勃发展的AI领域可能会改变这一状况。分析公司Gartner最近发布了边缘AI和在Kubernetes上运行的参考架构。两个指南都建议使用DPU——英伟达在其AI云参考架构中也是如此建议。
就在几天前,另一个主要参与者红帽也支持DPU。IBM的开源部门悄然宣布在OpenShift 4.19中推出"OpenShift DPU操作器"的技术预览版。
红帽告诉我们,他们认为DPU可以运行虚拟交换机、负载均衡器或防火墙。
OpenShift产品管理高级经理兼红帽杰出工程师Ju Lim告诉The Register,DPU还可用于"通过直接NVMe管理优化数据库和分析工作负载"。
Lim认为这些卡片在AI领域也有作用。他建议:"AI驱动的推荐引擎可以在DPU上运行推理工作负载,同时将主机资源专用于持续模型重训练,最大化性能和资源效率。"
因此,AI革命可能最终带来DPU革命。这确实是2025年的典型结果。
好文章,需要你的鼓励
机器人和自动化工具已成为云环境中最大的安全威胁,网络犯罪分子率先应用自动化决策来窃取凭证和执行恶意活动。自动化攻击显著缩短了攻击者驻留时间,从传统的数天减少到5分钟内即可完成数据泄露。随着大语言模型的发展,"黑客机器人"将变得更加先进。企业面临AI快速采用压力,但多数组织错误地关注模型本身而非基础设施安全。解决方案是将AI工作负载视为普通云工作负载,应用运行时安全最佳实践。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。