近日,《中国计算机学会通讯》(CCCF)刊发了中科院计算所特别研究助理严明玉博士、研究员范东睿以及研究员叶笑春共同撰写的综述文章《图神经网络加速芯片:人工智能“认知智能”阶段起飞的推进剂》。文章披露,为更好地支持认知智能的发展,该团队提出了国际首款图神经网络加速芯片设计HyGCN。目前,介绍该芯片设计的相关论文已先后在计算机体系结构国际顶级会议MICRO和HPCA上发表。
“HyGCN,寓意向图神经网络的加速说‘Hi’。”严明玉介绍道,图神经网络将深度学习算法和图计算算法相融合,取长补短,能达到更优的认知与问题处理等能力,在搜索、推荐、风险控制等重要领域有着广泛应用。现有的处理器芯片在执行图神经网络的计算中效率低下,其团队前瞻性地展开面向图神经网络的加速芯片设计,为解决这一难题提供了可行方案。
让机器“能理解、会思考”
图神经网络被认为是推动认知智能发展强有力的推理方法,有望解决深度学习无法处理的关系推理、可解释性等一系列问题,让机器“能理解、会思考”。2019年后,图神经网络逐渐成为各人工智能顶级会议的“热词”和研究热点,众多全球顶尖科技企业也已将图神经网络部署于数据中心中。
“作为近年来新兴的一种智能算法,图神经网络不仅在学术界被高度重视,也已然成为近年来工业界非常重要的应用之一。”严明玉介绍说,图神经网络能够备受学术界和工业界的青睐,归功于其强大的数据和知识理解能力,以及关系推理能力。
由于图神经网络在图数据处理方面的特殊性,传统用于加速神经网络的芯片难以直接对图神经网络的执行提供高效计算支撑。严明玉解释,以图数据为输入,融合了深度学习算法和图计算算法的图神经网络具有与传统神经网络不一样的执行行为,即“混合执行行为”。具体而言,规则执行行为和不规则执行行为共存于图神经网络中。“混合执行行为”对现有的处理器结构带来了巨大的挑战,比如,GPU在应对不规则执行行为时极为低效。
认知智能起飞的“推进剂”
“为了应对图神经网络的混合执行行为,我们设计了新的处理器结构,以更高效地加速图神经网络的执行。”严明玉介绍说,HyGCN芯片基于混合结构设计思想,分别为图神经网络的两个主要执行阶段——图遍历阶段和神经网络变换阶段设计相应的加速引擎,并流水两个引擎的执行。
研究团队的实践证明,HyGCN芯片设计,能够有效应对图神经网络图遍历阶段的不规则性,并能利用神经网络变换阶段的规则性提高执行效率。
“图神经网络加速芯片有望成为AI‘认知智能’阶段起飞的推进剂。我们基于12nm工艺,对HyGCN的芯片设计的核心部件在主流的图神经网络模型和图测试数据集上进行了初步的评估。”严明玉介绍说,相对于运行在Intel至强服务器CPU和英伟达V100 GPU的先进图神经网络软件框架,HyGCN分别取得了数万倍和60余倍的能效提升。
在“无人区”加快布局
近年来,中科院计算所围绕云计算、芯片、互联网、人工智能等前沿IT领域开展研创产协同创新,完善我国在端、网、云的计算基础设施布局,并鼓励通过技术转移体现科研人员和科技成果的价值。
从感知智能到认知智能,对人工智能技术的探索正挺向纵深。以中科院计算所为代表的中科院科研机构积极作为,大力推动科技创新,特别在以5G、人工智能、大数据等为代表的智能科技的发展方面,坚持面向世界科技前沿、面向国民经济主战场,不断向科学技术广度和深度进军,加快解决制约科技创新发展的关键问题。
“图神经网络加速芯片目前在国际上还是‘无人区’,研究成果发表后得到了业界认可。”严明玉表示,目前中科院计算所正加快对HyGCN科技成果进行孵化,提升关键核心技术能力,推动各行各业从信息化向智慧化升级。
应用空间巨大
图神经网络的潜在应用非常多。严明玉举例,在日常交通预测、网约车调度、金融诈骗侦查、运动检测等场景,在助力科研的知识推理、EDA工程、化学研究、宇宙发现等领域,以及在知识图谱、视觉推理、自然语言处理中的多跳推理等学科发展方向上,都有极大应用空间。
在工业界,图神经网络也已经有了落地应用。比如,谷歌地图的ETA评估、图片社交网站Pinterest的内容推荐、阿里巴巴的风控和推荐、腾讯等公司的视觉和风控等业务中都有图神经网络的影子。
由于图神经网络具有推理能力,认知智能还可以帮助机器跨越模态理解数据,学习到接近人脑认知的一般表达,从而获得类似于人脑的多模感知能力,进而有望带来颠覆性的产业价值。
Allied Market Research发布的机器学习芯片市场报告显示,2022年机器学习芯片市场规模预计将达到827.2亿美元。图神经网络加速芯片有望在接下来3年内与现有的神经网络芯片共生,甚至在5年后替换大部分的神经网络学习芯片,成为主流的机器学习芯片,可能将产生300亿美元以上的市场规模。
好文章,需要你的鼓励
近日Max Chan和我们分享了Avnet公司在现代数字领域得到的经验教训,从优化云支出到利用AI提高客户满意度。
金融服务公司Discover Financial Services采用容器化方法来实现其工作负载的敏捷性和灵活性,同时探索生成式AI的长期优势。
医生们会经常搜索PubMed及谷歌学术等数据库,翻阅UpToData主题摘要。有三分之二的从业者会使用MDCalc,这是一款带有各种决策支持功能的即时参考工具。此外,医生们还会访问专业协议网站、WebMD等医学网站,有时甚至还会参考非医学类网站。