超大规模图技术在京东电商场景中如何实现降本增效

10月26日,在AICC 2021人工智能计算大会上,京东集团副总裁、京东零售算法科学家包勇军发布了题为《超大规模图技术在京东电商场景的实践》的主题演讲。

作者:IT桔子/韩冬雪

导语:10月26日,在AICC 2021人工智能计算大会上,京东集团副总裁、京东零售算法科学家包勇军发布了题为《超大规模图技术在京东电商场景的实践》的主题演讲,并在会后接受记者采访,回答了关于AI计算未来的发力方向和发展方向以及AI技术在京东的具体应用场景等问题。

超大规模图技术在京东电商场景中如何实现降本增效

随着京东零售业务的发展,人工智能技术已经成为推动京东业务高速持续增长的重要动力。无论是电商营销,业务精细化运营还是用户交互的精准把握,都越来越依赖人工智能算法。

首先,整个算法的原材料,对于数据的精准把握以及复杂数据的建模,都依赖于图技术。那么图计算在电商业务有什么样的应用和探索?图技术目前面临一些什么样的挑战?应对这些挑战的图深度学习框架是怎样的?

包勇军表示,电商最重要的是对于商品和用户的理解,电商平台希望构建一个非常扎实的数据底座,通过商品图谱和用户图谱作为一个基础服务,支撑上层两类业务,一类是以搜索推荐、广告营销为主的用户精细化运营相关业务,另一类是反欺诈、反薅羊毛相关的风控类业务。

在电商用户精细化运营业务里,很多应用都同时依赖商品的图谱和用户的图谱来提供服务。商品方面,既要存储海量商品同时也要存储海量商品的关系数据,既包括静态图文关系,也包括复杂的基于用户行为交互而形成的动态商品关系。用户图谱实际上是对于用户群体画像的刻画,基于用户跟商品的交互等行为构建用户图谱,精准刻画用户的多维度信息。在风控领域,电商对风控的智能化要求较高,京东零售强调正品行货,强调社会责任感,所以京东非常重视对恶意商家的打击。因此需要识别刷单、恶意下单、恶意领券等严重伤害正常用户体验的行为。京东数据显示,93%以上的黑灰行为是通过团伙作案的,这种黑灰产实际上是自然的社会上的联盟。京东通过数据表征然后将团伙关系构建成图,利用图计算可以很方便地识别这种团伙。在具体业务效果上,利用京东图计算能力提升了识别效果2.55倍。

超大规模图技术在京东电商场景中如何实现降本增效

另外,图计算技术在电商领域的落地实践也面临一些挑战,包勇军表示,首先电商业务场景的现状是用户规模和商品数量非常庞大,如何使用图计算技术高效支撑业务落地至关重要。其次是基础设施,基础设施不光包括服务器,而是泛指软硬联合的一体化基础设施,这也是图计算领域必须依赖的能力。包勇军认为,图计算的挑战首先在存储,图计算需要高效灵活的存储,可以支持复杂的数据结构。另外,除了存储,线上服务还需要毫秒级的响应,对计算性能的要求也很高。除了这些基本挑战,还需要进一步支撑目前前沿复杂算法的实现。

基于以上挑战,我们需要一个高效的图计算框架来满足这些需求。但目前市场上已有的图计算框架其实很难满足电商领域超大规模计算量的需求,电商领域的图计算框架既需要支持大规模计算量,又需要支持异构数据,同时还要支持多种后端。包勇军表示,电商推荐本质是解决一个关联性的问题,即用户和商品的匹配问题,因此自然而然就能形成了用户和商品间的二部图。基于 Galileo图计算引擎,京东零售在推荐业务上构建了多元异构的图,其中既包含用户基本属性,商品的交互行为信息,还包括商品类目和品牌信息等。用户和商品的交互行为包括浏览、加购、分享、打赏、点赞、收藏等,实际上都能够以图模型进行建模,通过加购、浏览、共享等行为序列,自然形成一个边关系行为链条。基于以上构建好的图谱,京东零售也进一步做了一些算法方面的创新工作,既可以实现对于用户短期行为的序列图建模,又能够利用用户长期行为和商品交互信息进行建模,对多重语义空间节点进行建模,从而学习用户潜在的兴趣。

在会后采访环节,包勇军回答了AI计算未来的发力方向和发展方向,并详细阐述了AI计算在京东的应用场景。包勇军表示,现阶段各个行业都在做智能化转型,其中AI计算是目前亟需突破的技术,而这中间需要发力的方向很多。包括自动驾驶技术、元宇宙、虚拟现实等。但从产业角度来看,AI目前还有一定门槛,特别是大量传统企业经过数据的数字化转型后,下一步就是智能化转型。那么如何降低传统企业在智能化转型的难度,提升企业效能是AI重要的发展方向,可以将AI技术发展方向拆解为以下4层:

第一是芯片,特别是在整个中美经济贸易纠纷情况下,芯片成为了一个重要发展的技术方向。芯片代表AI算力,能否研发出高效的服务器,充分发挥芯片算力,也是重要的发展方向。

第二是自动学习技术,自动学习是通过AI技术驱动,自动化的分析真实世界的场景,并完成端到端的AI建模。通过自动学习技术,可以真正实现AI建模的自动化以及技术的普适化。

第三是如何将AI技术在真实场景应用,以京东自身实践为例,京东把整个应用分为两层。首先是技术层应用,包括文本自然语言理解,计算机视觉等,主要是自动化风控、信息安全、合规审核,这种自动化技术,可以自动标注以及自动识别风险,大大降低成本和支出的投入。另外,视频、语音现在新兴的交互媒体出来之后,涉及到更多对于复杂富媒体的理解问题,包括一些机器的翻译、视频的自动识别,大量用到算法的技术。这些底层能力赋能京东整个业务场景,包括业务的精细化运营。

最后,AI落地过程中需要应用大量数据,关于用户隐私安全的保障是重要的技术发展方向。以京东为例,京东作为电商行业,对于国家的法规,个人隐私保护一直以来都很重视。一是生态系统的数据合规,二是整个数据应用合规,包括京东自身数据、在自身场景上的应用如何保障用户隐私安全,最后域外的数据进入京东的域,如何用技术手段保障业务合规,多方数据融合时如何做到技术合规。以上这些都是未来AI技术需要发力的方向。

来源:业界供稿

0赞

好文章,需要你的鼓励

2021

11/26

16:10

分享

点赞

邮件订阅
白皮书