AI的下一个拐点：图神经网络迎来快速爆发期

发布时间：2021-07-10 18:08:24 所属栏目：大数据来源：互联网

导读：01 GNN：从尝鲜进入快速爆发期今年以来，图神经网络技术(Graph Neural Network， GNN)得到了学术界极大的关注与响应。各大学术会议纷纷推出 GNN 相关的 workshop，在投中的论文中，以 Graph Network 为关键词的论文数量也呈现井喷之势，下图给出了近三年，

01 GNN：从尝鲜进入快速爆发期

今年以来，图神经网络技术(Graph Neural Network， GNN)得到了学术界极大的关注与响应。各大学术会议纷纷推出 GNN 相关的 workshop，在投中的论文中，以 Graph Network 为关键词的论文数量也呈现井喷之势，下图给出了近三年，上述关键词在各学术会议上的增长趋势：

GNN 在经历过 2017-2018 年两年的孕育期与尝试期之后，在 2018 年末至今的一年多时间里，迎来了快速爆发期。从理论研究到应用实践，可谓是遍地开花，让人应接不暇。

在理论研究上，GNN 的原理解释、变体模型以及对各种图数据的拓展适配等工作成为了主流。而在应用实践上，GNN 更是展现出了前所未有的渗透性，从视觉推理到开放性的阅读理解问题，从药物分子的研发到 5G 芯片的设计，从交通流量预测到 3D 点云数据的学习，我们看到了 GNN 极其广阔的应用前景。

本文将对近一年各大顶级会议(如 ICML、NIPS、CVPR、ACL、KDD 等)上的 GNN 相关论文进行梳理，重点从理论研究和应用实践两方面解读过去一年 GNN 的进展。由于时间和篇幅有限，本文并没有对每一个方向都进行全面的总结与概括，感兴趣的读者可以根据文中给出的论文链接自行查漏补缺。

02 GNN 的原理、变体及拓展

GNN 作为一个新兴的技术方向，其原理解读以及各类变体与拓展构成了理论研究的热点，这些论文很好地回答了 GNN 的优缺点以及相关的适应性改造问题。

1. GNN 原理解读

当前 GNN 研究的第一个热点在于其相关能力的理论化研究。在 “How Powerful are Graph Neural Networks?” 和 “On the equivalence between graph isomorphism testing and function approximation with GNNs” 中，都对 GNN 在图同构问题上的表现进行了探讨。

图同构问题是辨别给定的两个图是否一致，同构图如下图所示。这个问题考验了算法对图数据结构的辨别能力，这两篇文章都证明了 GNN 模型具有出色的结构学习能力。

图中天然包含了关系，因此许多 GNN 相关的工作就建立在对给定系统进行推理学习的研究上，在这些研究中，“Can graph neural networks help logic reasoning? ” 和 “The Logical Expressiveness of Graph Neural Networks” 论证了 GNN 在逻辑推理上的优秀表现。“All We Have is Low-Pass Filters ” 从低通滤波的层面解释了 GNN 的有效性。

这些原理解读，有助于我们对 GNN 的特色专长建立一种更加清晰的认识。

2. GNN 的各类变体

GNN 模型的相关变体研究是领域内的另一个热点，这些变体在一些方面提升了 GNN 的能力表现。我们知道 GCN 模型来源于图信号上的傅里叶变换，“Graph Wavelet Neural Network” 引入了图信号上的小波变换来改造 GCN 模型，将卷积计算变换到空域局部邻域内。

将数据表征从欧式空间转化到双曲空间，不仅能获得更好地层次化表示，同时能大大节约空间维度，“Hyperbolic Graph Convolutional Neural Networks”和 “Hyperbolic Attention Networks” 同时将 GNN 拓展到了双曲空间上去。

在 “MixHop: Higher-Order Graph Convolutional Architectures via Sparsified Neighborhood Mixing” 和 “Diffusion Improves Graph Learning”中，同时将原始 GCN 中的邻居定义由一阶拓展到高阶，强化了模型低通滤波的特性。

3. GNN 在各类图数据及任务上的拓展

图数据是一个种类繁多的数据家族，模型对这些不同类型的数据如何适配，是 GNN 发展的另一重要方向。下表给出了相应的概括：

图类型相关说明对应论文

属性图多种节点类型，节点包含属性，最具代表性 [1] [2]

超图一条边同时连接两个以上节点 [3]

动态图图结构随时间演化 [4]

隐式图节点之间没有显式边，需要先学习图的结构 [5] [6]

[1]: HetGNN: Heterogeneous Graph Neural Network

https://www.kdd.org/kdd2019/accepted-papers/view/hetgnn-heterogeneous-graph-neural-network

[2]: Representation Learning for Attributed Multiplex Heterogeneous Network

https://arxiv.org/abs/1905.01669

[3]: HyperGCN: A New Method For Training Graph Convolutional Networks>https://arxiv.org/abs/1809.02589

[4]: DyRep: Learning Representations over Dynamic Graphs

https://openreview.net/pdf?id=HyePrhR5KX

[5]: Semi-supervised Learning with Graph Learning-Convolutional Networks

http://openaccess.thecvf.com/content_CVPR_2019/papers/Jiang_Semi-Supervised_Learning_With_Graph_Learning-Convolutional_Networks_CVPR_2019_paper.pdf

[6]: Learning Discrete Structures for Graph Neural Networks

https://arxiv.org/abs/1903.11960

在图数据相关的任务上，图的分类是一个重要而又未完全解决好的问题，其难处在于如何在图数据上实现层次化的池化操作从而获得图的全局表示，“Graph Convolutional Networks with EigenPooling”中给出了一种新的操作思路。

03 GNN 相关应用

近几年，以深度学习为代表的人工智能技术给产业界带来了新的变革。该技术在视觉、语音、文本三大领域取得了极大的应用成果，这种成功，离不开深度学习技术对这三类数据定制化的模型设计工作。

脱离于这三类数据之外，图数据是一种更加广泛的数据表示方式，夸张地说，没有任何一个场景中的数据彼此之间是孤立存在的，这些数据之间的关系都可以以图的形式进行表达。下图给出了一些图数据的使用场景：

如何将图数据的学习与深度学习技术进行深度结合成为了一个迫切且紧要的需求。在这样的背景之下，图神经网络技术的兴起恰似一股东风，第一次使得我们看到了深度学习应用到图数据之上的曙光。

实际上，在最近一年，GNN 的应用场景不断延伸，覆盖了计算机视觉、3D 视觉、自然语言处理、科研、知识图谱、推荐、反欺诈等场景，下面我们将逐项概括。

1. 计算机视觉

在前几年跨越了视觉识别的大门之后，推理相关的视觉任务已经成为了了各大 CV 顶会的主要关注点，如：视觉问答、视觉推理、语义图合成、human-object interaction 等，甚至如视觉的基础任务，目标检测也需要用到推理来提升性能。在这些任务中，已经大量出现应用 GNN 的相关工作。

下面我们以最常见的视觉问答任务举例说明，在“Relation-Aware Graph Attention Network for Visual Question Answering”一文中，给出了将 GNN 与视觉模型结合的示意图：

在上图中，视觉模型的作用是提取给定图像中的语义区域，这些语义区域与问题一并当做图中的节点，送到一个 GNN 模型中进行推理学习，这样的一种建模方式，可以更加有效地在视觉问答中对问题进行自适应地推理。

另外一个有意思的场景是少样本或零样本学习，由于这类场景下样本十分缺乏，如何充分挖掘样本之间的潜在关联信息(比如标签语义关联、潜层表达关联)就成为了一个至关重要的考量因素，引入 GNN 成为了一个非常自然的动作，相关工作有“Rethinking Knowledge Graph Propagation for Zero-Shot Learning”“Edge-labeling Graph Neural Network for Few-shot Learning”。

2. 3D 视觉

3D 视觉是计算机视觉的又一重要发展方向，世界是 3D 的，如何让计算机理解 3D 世界，具有极其重要的现实价值。3D 视觉中，点云数据是一种十分常见的数据表示方法。

点云数据通常由一组坐标点(x,y,z)表示，这种数据由于映射了现实世界中物体的特征，因此存在一种内在的表征物体语义的流行结构，这种结构的学习也是 GNN 所擅长的。

需要说明一点的是，在 3D 视觉中流行的是几何学习 Geometry Learning，当下，几何学习与 GNN 在一些场景如点云分割、点云识别等正在深度融合，相关论文有 “Graph Attention Convolution for Point Cloud Segmentation”“Semantic Graph Convolutional Networks for 3D Human Pose Regression”。

3. 自然语言处理

GNN 与 NLP 的结合，关键点也在于 GNN 优秀的推理能力。GNN 在一些场景如：阅读理解、实体识别与关系抽取、依存句法分析中都有应用。

下面我们以多跳阅读(Multi-hop reading)为例，多跳阅读是说在阅读理解的过程中，往往需要在多篇文档之间进行多级跳跃式的关联与推理，才能找到正确答案，相比较以前的单文档问答数据集，这是一个更具有开放性与挑战性的推理任务。下图给出了多跳阅读的样例：

在“Cognitive Graph for Multi-Hop Reading Comprehension at Scale”一文中，作者基于 BERT 和 GNN 的实现可有效处理 HotPotQA 数据集中有关多跳阅读问题的数百万份文档，在排行榜上的联合 F1 得分为 34.9，而第二名的得分只有 23.6。

（编辑：宿州站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

1/2

尾页