浙江大学创新软件研发中心

InnovativE SoftwAre TechnoloGy DeveLopment CentEr, EAGLE-Lab

 

EAGLE-Lab博士生顾铭的论文被信息检索领域知名会议CIKM 2023录用

The ACM Conference on Information and Knowledge Management (CIKM) 是数据库管理、信息检索和知识管理等研究领域的权威会议之一。近期,CIKM 2023的录用结果揭晓,共有1472篇有效全文投稿,最终录用354篇,录用率为24%。EAGLE-Lab信息无障碍团队的博士生顾铭的图聚类论文《Homophily-enhanced Structure Learning for Graph Clustering》被CIKM 2023录用为全文。

图数据(Graph)在现实世界中随处可见。由于图的固有异构性,其中存在潜在的聚类结构,对理解图的性质至关重要。尽管现有的基于图神经网络(GNN)的图聚类方法取得了显著的进展,但它们往往忽视了输入图的质量,在整个聚类过程中仅利用原始结构。由于图复杂且偶然的生成过程可能会导致次优的图结构,包括连接的缺失与错误,从而影响了现有方法在节点表征学习及其下游任务中的表现。

本文探索了图结构学习如何推进基于图神经网络(GNN)的图聚类,通过在训练期间显式利用图聚类信息学习富含同质性的图结构,并提出层次相关性估计和聚类感知稀疏化两个模块,重新设计标准结构学习方法的两个关键部分,形成结构学习与图聚类相互增强的优化循环,提高所学结构的同质性,进而增强图聚类效果。实验表明,基于图聚类信息学习增强图结构的同质性可以同时有益于GNN表征学习和图聚类,该方法在七个基准数据集上都能达到相当或超越当前的基线模型的效果。

论文和模型代码已在Github仓库公开,地址为: https://github.com/galogm/HoLe