近日,《中国计算机学会通讯》(CCCF)刊发了中科院计算所特别研究助理严明玉博士、研究员范东睿以及研究员叶笑春共同撰写的综述文章《图神经网络加速芯片:人工智能“认知智能”阶段起飞的推进剂》。文章披露,为更好地支持认知智能的发展,该团队提出了国际首款图神经网络加速芯片设计HyGCN。目前,介绍该芯片设计的相关论文已先后在计算机体系结构国际顶级会议MICRO和HPCA上发表。
“HyGCN,寓意向图神经网络的加速说‘Hi’。”严明玉介绍道,图神经网络将深度学习算法和图计算算法相融合,取长补短,能达到更优的认知与问题处理等能力,在搜索、推荐、风险控制等重要领域有着广泛应用。现有的处理器芯片在执行图神经网络的计算中效率低下,其团队前瞻性地展开面向图神经网络的加速芯片设计,为解决这一难题提供了可行方案。
让机器“能理解、会思考”
图神经网络被认为是推动认知智能发展强有力的推理方法,有望解决深度学习无法处理的关系推理、可解释性等一系列问题,让机器“能理解、会思考”。2019年后,图神经网络逐渐成为各人工智能顶级会议的“热词”和研究热点,众多全球顶尖科技企业也已将图神经网络部署于数据中心中。
“作为近年来新兴的一种智能算法,图神经网络不仅在学术界被高度重视,也已然成为近年来工业界非常重要的应用之一。”严明玉介绍说,图神经网络能够备受学术界和工业界的青睐,归功于其强大的数据和知识理解能力,以及关系推理能力。
由于图神经网络在图数据处理方面的特殊性,传统用于加速神经网络的芯片难以直接对图神经网络的执行提供高效计算支撑。严明玉解释,以图数据为输入,融合了深度学习算法和图计算算法的图神经网络具有与传统神经网络不一样的执行行为,即“混合执行行为”。具体而言,规则执行行为和不规则执行行为共存于图神经网络中。“混合执行行为”对现有的处理器结构带来了巨大的挑战,比如,GPU在应对不规则执行行为时极为低效。
认知智能起飞的“推进剂”
“为了应对图神经网络的混合执行行为,我们设计了新的处理器结构,以更高效地加速图神经网络的执行。”严明玉介绍说,HyGCN芯片基于混合结构设计思想,分别为图神经网络的两个主要执行阶段——图遍历阶段和神经网络变换阶段设计相应的加速引擎,并流水两个引擎的执行。
研究团队的实践证明,HyGCN芯片设计,能够有效应对图神经网络图遍历阶段的不规则性,并能利用神经网络变换阶段的规则性提高执行效率。
“图神经网络加速芯片有望成为AI‘认知智能’阶段起飞的推进剂。我们基于12nm工艺,对HyGCN的芯片设计的核心部件在主流的图神经网络模型和图测试数据集上进行了初步的评估。”严明玉介绍说,相对于运行在Intel至强服务器CPU和英伟达V100 GPU的先进图神经网络软件框架,HyGCN分别取得了数万倍和60余倍的能效提升。
在“无人区”加快布局
近年来,中科院计算所围绕云计算、芯片、互联网、人工智能等前沿IT领域开展研创产协同创新,完善我国在端、网、云的计算基础设施布局,并鼓励通过技术转移体现科研人员和科技成果的价值。
从感知智能到认知智能,对人工智能技术的探索正挺向纵深。以中科院计算所为代表的中科院科研机构积极作为,大力推动科技创新,特别在以5G、人工智能、大数据等为代表的智能科技的发展方面,坚持面向世界科技前沿、面向国民经济主战场,不断向科学技术广度和深度进军,加快解决制约科技创新发展的关键问题。
“图神经网络加速芯片目前在国际上还是‘无人区’,研究成果发表后得到了业界认可。”严明玉表示,目前中科院计算所正加快对HyGCN科技成果进行孵化,提升关键核心技术能力,推动各行各业从信息化向智慧化升级。
应用空间巨大
图神经网络的潜在应用非常多。严明玉举例,在日常交通预测、网约车调度、金融诈骗侦查、运动检测等场景,在助力科研的知识推理、EDA工程、化学研究、宇宙发现等领域,以及在知识图谱、视觉推理、自然语言处理中的多跳推理等学科发展方向上,都有极大应用空间。
在工业界,图神经网络也已经有了落地应用。比如,谷歌地图的ETA评估、图片社交网站Pinterest的内容推荐、阿里巴巴的风控和推荐、腾讯等公司的视觉和风控等业务中都有图神经网络的影子。
由于图神经网络具有推理能力,认知智能还可以帮助机器跨越模态理解数据,学习到接近人脑认知的一般表达,从而获得类似于人脑的多模感知能力,进而有望带来颠覆性的产业价值。
Allied Market Research发布的机器学习芯片市场报告显示,2022年机器学习芯片市场规模预计将达到827.2亿美元。图神经网络加速芯片有望在接下来3年内与现有的神经网络芯片共生,甚至在5年后替换大部分的神经网络学习芯片,成为主流的机器学习芯片,可能将产生300亿美元以上的市场规模。
好文章,需要你的鼓励
"影子AI"是指员工在未经公司批准的情况下使用AI工具办公。虽然ChatGPT等工具能提升效率,但将内部文件、客户数据或源代码输入未授权平台,可能导致企业数据失控。IBM报告显示,20%的企业存在未授权AI工具,63%尚无AI治理政策。专家建议,一味封禁效果有限,企业应明确哪些工具可用、哪些数据禁止上传,员工也应主动核查AI输出内容,避免将敏感信息粘贴至公共AI平台。
阿里Qwen团队通过引入强化学习和在线策略蒸馏,将Qwen-Image-2.0升级为Qwen-Image-2.0-RL,让图像生成模型真正学会人类审美,文生图Elo评分提升78分,图像编辑提升93分。
Hirebotics联合Fanuc发布首款基于无代码Beacon平台的防爆协作喷涂机器人Cobot Painter。该方案适用于金属制造商,无需专用喷涂房或复杂编程,可在现有人工喷涂环境中数日内完成部署。操作人员通过平板或手机的"点击示教"功能即可引导机器人完成路径学习,实现液体涂料、粉末涂装等高精度重复作业,帮助制造商将涂装业务收回自主管理。
港科大与快手联合提出NormGuard,针对流匹配模型强化学习训练中速度范数膨胀问题,通过训练时单向惩罚约束,在保留奖励的同时改善图像真实感。