人工智能学院常毅教授与曹晓锋副教授联合指导的2021级硕士研究生陶杨同学主要从事图神经网络与自监督学习的研究工作,其最新研究被《Information Sciences》接收。《Information Sciences》是Elsevier旗下信息科学领域权威级期刊,主要报道计算智能、机器学习和数据挖掘等领域的最新研究进展。该期刊当前影响因子为IF(2022)= 8.233,属于中科院分区一区,CCF-B类刊物,也是信息系统Top期刊。
论文题目:Breaking the Curse of Dimensional Collapse in Graph Contrastive Learning: A Whitening Perspective
论文作者:陶杨
通讯作者:曹晓锋,常毅
收录期刊:Information Sciences
期刊类别:CCF-B,中科院一区
论文概述:
在图对比学习(GCL)中,维度崩溃将节点嵌入限制在其低维子空间中,从而降低了它们的区分度。然而,这种困境的原因和解决方案还相对未被充分探索。在统计学中,白化是消除多个变量之间相关性的有力工具。这激发了本工作从白化的角度来缓解GCL的维度崩溃。在本文中,提出了一种直观的分析,表明节点嵌入的高相似性得分可能导致维度崩溃,并为其存在提供了更多证据。考虑到白化在统计学中的成功,本工作引入了一个名为白化图对比学习(WGCL)的新的即插即用模块,以解决现有GCL方法中的维度崩溃问题。WGCL插件标准化了尺寸的协方差矩阵,消除了节点嵌入尺寸之间的相关性。此外,本工作通过引入一个在输入特征和节点嵌入之间的互信息最大化损失来增强传统GCL训练目标,以保持信息容量。实验表明,WGCL有效地解决了维度崩溃问题,使三种GCL主干在九个广泛使用的数据集上的分类准确率平均提高了0.93%(高达2.0%)。
图:提出的白化图对比学习(WGCL)插件在两个方面改进了传统的GCL。首先,在每个GNN层之后引入了一个节点洗牌白化模块,以去相关节点嵌入的维度。其次,为了进一步增强白化的效果,引入了增强白化的损失,以最大化输入特征和每一层嵌入之间的互信息。结果,WGCL插件去相关了节点嵌入的维度,从而提高了下游任务的性能。