中科驭数的芯片梦:让每个服务器都有DPU

作者:邹大斌   【原创】   2021-04-07 16:45:32

关键字: DPU 异构计算

与目前市场的大多数DPU采用众核机构不同,中科驭数选择了异构核的技术路线,通过即时的软件配置来定义芯片内部数据运算逻辑,在保障充沛算力的同时,以最低功耗支撑更多运算负载类型。

CPU一统江湖的局面正在慢慢被蚕食,这些蚕食者就是各种名为“XPU”的“小弟”,如GPU、DPU、IPU等等,其中GPU目前已经得到市场普遍认可,成长非常快,而DPU、IPU以及各种专用AI芯片还有待市场验证。

在中科驭数创始人兼CEO鄢贵海看来,DPU很可能是继GPU之后又一个有望引爆的芯片市场。中科驭数是一家2018年才刚刚成立的初创公司,选择的正是DPU这条赛道。不久前,中科驭数发布了其下一代DPU芯片计划,将基于自研的KPU(Kernel Processing Unit)芯片架构,围绕网络协议处理、数据库和大数据处理加速、存储运算、安全加密运算等核心功能,推出新一代DPU芯片。

风口上的DPU

今天DPU(Data Processing Unit)是业内的热点话题,不过,鄢贵海告诉至顶网记者,中科驭数创业时其实并不清楚有DPU这类芯片的存在,只是因为看到了市场对DPU的需求,而自己有技术实力才进入这个市场。中科驭数的核心创业团队来自中科院计算所计算机体系结构国家重点实验室,十多年从事计算机体系结构的研究经历使得他们非常了解产业的最新变化。

“做着做着,我们发现我们做得事情和国外一些公司做得一样,这就是市场说的DPU。” 鄢贵海说。

鄢贵海解释说,作为最新发展起来的一种专用处理器,DPU其产生的背景是数字智能时代,数据爆发导致的对计算延迟、数据安全、资源虚拟化的需求。

最初,数据中心的所有工作都由CPU来承担,无论是数据的处理、数据的传输还是图像的渲染。在数据量不太大的时候,CPU还能胜任,而随着数据量爆炸性的增长,单纯依靠CPU来打理一切变得不太可行,或者说不经济。这才有了GPU、DPU等芯片的出现。

其实,在现代数据中心中,CPU的处理能力中很大一部分被用于执行基础设施管理任务,例如扫描网络流量中是否存在恶意软件以及编排存储设备,而DPU芯片如果接管其中一部分任务,就可以释放CPU的计算能力去执行更高价值的任务,其潜在运营收益是巨大的。据估计,基础设施管理任务将占数据中心CPU核心处理能力的20%至30%,这也正是DPU的价值所在。

简单地说,CPU相当于一个通才,它长处是什么都能干,但效率不高,而GPU、DPU相当于专才,专门干一件或者一类事情,因此效率最高。今天,不少企业开始将CPU、GPU、DPU组合,来实现更经济的效果。 在这个组合中CPU负责构建应用生态,GPU负责图像处理核深度学习训练,DPU负责卸载基础层应用,比如网络、安全、数据压缩等。这就是我们今天说的异构计算。

谈到CPU、GPU和DPU的区别,鄢贵海做了一个形象的比喻:如果把一台计算机或服务器比作一个团队,CPU相当于这个团队的“大管家”,负责思考并处理各种业务;GPU是“美工”,专攻图像处理;DPU则相当于“前台”,负责打包、拆包“数据包”,提升整个团队的工作效率。

异构核还是众核?

在DPU的潜在市场,目前已经有了不少玩家,既有Intel、Broadcom、Marvall、Nvidia等巨头,也有Fungible、Pensando等初创公司。这些公司中对DPU市场影响最大的可能是NVIDIA,正是NVIDIA让DPU成为一个业内热词。去年,Nvidia发布了名为BlueField-2的DPU,今年应该会正式上市。不过,在行动上走得比较早的可能是Fungible,目前Fungible已经由两款DPU芯片上市。

中科驭数与这几家走的是不同的技术路线,这几家选择的是众核,而中科驭数是异构核。通俗地说,就是Nvidia和Fungible的DPU的多个核是同构的,其中,Nvidia采用的是基于ARM的多核架构,Fungible采用的是基于MIPS的多核架构,而中科驭数DPU的多核是不同架构的,比如其中四个核心可能一个专门面向安全设计,一个面向网络设计,一个面向数据库设计,一个面向AI设计,架构各不相同。

这背后的一个重要技术原因是,中科驭数创新性提出了软件定义加速器技术(Software Defined Accelerator),自主研发了KPU(Kernel Processing Unit)芯片架构。KPU架构凝聚了中科驭数创始团队近十年在体系结构方面研究成果和研发经验的积累。其相较于传统的ASIC或SOC DPU芯片架构,具有极高的灵活性,可以通过即时的软件配置来定义芯片内部数据运算逻辑,在保障充沛算力的同时,以最低功耗支撑更多运算负载类型。

鄢贵海表示,中科驭数的DPU以针对性算法加速为核心,通过KPU架构来组织异构核。在KPU架构下,中科驭数研发了国内首款芯片级完善的L2/L3/L4层全网络协议处理核,推出了直接面向OLAP、OLTP及类SQL处理的数据查询处理核,而没有采用原来众核为主的架构。

2019年成功流片的数据库与时序数据处理融合加速芯片

“异构核架构将带来更高效的数据处理效率、获得更直接的使用接口,以及更佳的虚拟化支持。”鄢贵海介绍。

据悉,2019年中科驭数成功流片业内首颗数据库与时序数据处理融合加速芯片。目前,芯片产品已经分别在金融领域的实时风控、大数据处理和异构数据库加速等领域得到实际应用,并且得到非常用户非常积极的反馈。今年将会推出第二代产品,功能层面包括完善的L2/ L3/L4层的网络协议处理,可处理高达200G网络带宽数据。其次融合数据库、大数据处理能力,直接面向OLAP、OLTP及大数据处理平台,如Spark等。另外还囊括机器学习计算核以及安全加密运算核。接下来的2022、2023年也将分别新一代的产品推出,制程工艺也将分别从2019年的55纳米,到今年的28纳米,到明后年的12纳米和7纳米。

鄢贵海表示,DPU可能是一个比GPU更大的市场。“不一定每台服务器都需要GPU,但很有可能每台服务器都可能要一个DPU。”

机会很大,挑战也不小,对于中科驭数而言,最大的挑战还是要继续打磨自己的产品,用更多的成功案例来教育客户,赢得市场,让客户看到异构核DPU的价值。明知这条路上一定荆棘密布,但对技术的自信和对成功的渴望依然吸引鄢贵海带领中科驭数一路向前。

    扫一扫

    分享文章到微信


    北京第二十六维信息技术有限公司(至顶网)版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号
    举报电话:13070156560 举报邮箱:jubao@zhiding.cn 安全联盟认证