浙江大学创新软件研发中心

InnovativE SoftwAre TechnoloGy DeveLopment CentEr, EAGLE-Lab

 

EAGLE实验室硕士生贝元琛的论文被数据挖掘领域顶级会议KDD2025录用

KDD是数据挖掘领域的顶级会议之一,是中国计算机学会(CCF)的A类推荐会议。KDD 2025分为两轮投稿周期,其中第一轮投稿周期共收到了967份有效投稿,录用率约19%。EAGLE实验室硕士生贝元琛的论文《Correlation-Aware Graph Convolutional Networks for Multi-Label Node Classification》被KDD2025 research track录用。


图神经网络(GNNs)已经在图数据挖掘的任务中都取得了巨大成功。对于节点分类任务,传统图神经网络主要更关注各节点数据单标签类别的场景。在现实世界中,许多节点属于多个类别,如社交网络中的用户多兴趣,使得GNNs在处理多标签场景时可能会存在特征和拓扑结构的模糊性问题,分析如图1-(a)所示:
(1)模糊特征(Ambiguous Feature):在单标签设置中,节点可以通过转换特征从邻域节点中聚合特定类型的标签模式。然而,在多标签设置中,与非图数据上的数据特征存在模糊问题类似,一个节点的特征可能与多个标签相关,特征所代表的模式是模糊的。因此,从这些模糊特征中聚合信息将影响节点表示的区分能力。图1-(b)展示了在现实世界的图中,分配相似特征的节点可能共享不同的标签数量。
(2)模糊拓扑(Ambiguous Topology):在单标签设置中,连接的节点通常共享相同的单一标签,因此沿边传播的模式通常是确定性的。然而,在多标签设置中,连接的节点都有多个标签,沿边传播的模式通常是模糊的。这种模糊性使得我们难以确定应该从哪些连接的节点中聚合特定标签的信息。直接从所有邻居那里聚合信息将进一步累积模糊性,影响了特定标签的推断。图1-(c)展示了在现实世界的图中,连接的节点可能共享不同的标签数量。

图1:(a)多标签节点分类示例;(b)-(c) 示例数据集上的模糊特征和模糊拓扑。

针对分析所发现的问题,本文提出了一种名为Correlation-Aware Graph Convolutional Network的方法,整体思路如图2所示,包括:
(a)关联感知图分解(Correlation-Aware Graph Decomposition):首先学习与标签相关的节点特征,并将它们分解为多个标签感知特征。然后,基于分解后的特征,进一步分解出多个标签感知图用于各标签消息传播路径增强。
(b)关联增强图卷积(Correlation-Enhanced Graph Convolution):每一层包括在每个标签感知视图中的邻域内消息传递以及标签感知视图之间的标签间相关性传播。

图2:所提出模型的整体示例。

综上,在这篇论文中,我们针对当前图神经网络在进行多标签分类时面临的潜在问题进行了分析,提出了一种增强方案来提高现有图神经网络在多标签分类场景的能力。在实验测试中,验证了所提出模型的有效性。

论文链接如下:
https://arxiv.org/pdf/2411.17350