在本文中,我们将共同了解DPU是什么、DPU的工作原理、DPU的优势、如何选择合适的DPU供应商,以及更多常见问题解答。
数据处理单元,简称DPU,已经成为持续发展的现代计算领域的又一支柱,领先于中央处理器(CPU)和图形处理单元(GPU)。
DPU能够与CPU和GPU协同工作,负责增强计算能力并处理日益复杂的现代数据工作负载。随着全社会对AI、机器学习、深度学习、物联网、5G及复杂云架构需求的增加,DPU市场也在稳步增长。如果您的团队参与到高级计算项目当中,那么将DPU引入数据中心架构也许会为您带来新的收益。
在本文中,我们将共同了解DPU是什么、DPU的工作原理、DPU的优势、如何选择合适的DPU供应商,以及更多常见问题解答。
所谓DPU,或者说数据处理单元,是一种可编程处理器,旨在高效处理数据中心内的大规模数据工作负载,包括数据传输、规约、保护、压缩、分析和加密等。
DPU正迅速成为现代计算中的重要组成部分,能够帮助CPU分担数据相关工作负载以提升数据中心的整体效率和性能。
DPU通过以下主要功能为现代数据中心带来了诸多收益:
DPU有如下几大特点:
DPU供应商可根据企业客户的需求在产品当中应用不同的技术和材质。DPU主要分为三种类型:基于SOC型,基于ASIC型和基于FPGA型。每一种都是针对特定用例或客户系统所量身定制,因此您应根据实际需求选择适当的DPU供应商。
目前,DPU市场上的主要供应商包括英伟达、Marvell、Fungible(已被微软收购)、博通、英特尔、Resnics以及AMD Pensando。随着更多新厂商的加入,预计这份专为数据类高级工作负载提供解决方案的名单还会继续延伸。未来几年,DPU领域很可能成为各大科技巨头和芯片制造商所激烈争夺的战场。
要根据需求选择合适的DPU供应商,您需要综合考虑多方面因素:
|
名称 |
CPU |
GPU |
DPU |
|
含义 |
中央处理单元 |
图形处理单元 |
数据处理单元 |
|
功能 |
主处理器负责计算机系统的整体运行,是计算机的“大脑” |
图形计算任务专用处理器,负责执行3D图像渲染或视频处理等专项任务 |
专门处理以数据为中心的工作负载,例如数据中心的网络、存储及安全操作 |
|
架构 |
包含大量针对串行处理优化的强大处理核心,长于按顺序逐个执行任务 |
包含大量针对并行处理优化的较简单核心,长于同时处理大量任务 |
由处理核心、硬件加速器元件和高性能网络接口组合而成,负责处理以数据为中心的大规模任务 |
|
相关用例 |
存在于几乎一切计算设备当中,包括智能手机、计算机、服务器等 |
常被用于游戏PC设备 |
主要用于数据中心 |
DPU可以为CPU分担数据相关的工作负载,借此帮助数据中心基础设施提高效率、加快数据处理速率并减少CPU负担,从而实现更快、更可靠的数据处理能力。
要使用DPU,您的服务器或网络设备必须具备可兼容DPU卡的PCIe插槽。硬件还应具有兼容的操作系统和驱动程序、可供DPU正常运行的充足内存,以及稳定可靠的电源和冷却系统。
凭借强大的规模化数据处理能力,DPU可以替CPU分担网络和通信类工作负载。这种以数据为中心的工作负载包括数据分析、传输、规约、安全、压缩、分析和加密等。DPU也是存储网络的理想选择。其实际应用可能包括AI与机器学习、大数据分析和处理、视频转码与流媒体、网络流量处理与安全,以及存储I/O加速。
可用于DPU的数据加速引擎包括加密/解密、压缩/解压缩、数据规约、AI/机器学习推理与网络等。这些数据加速引擎能够替CPU分担特定类型的工作负载,从而提高效率、性能和安全性。
随着市场对数据密集型应用需求的不断增加,相应的计算架构也将持续发展,并对数据处理的速度、效率和安全性提出更多要求。根据Allied Market Research的一份报告,到2031年,全球数据处理单元市场总值预计将达到55亿美元,从2022年至2031年期间的年均复合增长率为26.9%。因此,DPU也许会从如今的可选组件逐步发展成下一代计算架构中的标准组成部分。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。