人工智能学院王鑫老师指导的2020级硕士研究生杨银涛的论文Contrastive Graph Convolutional Networks with Adaptive Augmentation for Text Classification近日被 Information Processing & Management杂志接收。 Information Processing & Management是Elsevier出版社旗下的中科院一区TOP期刊(CCF-B),SCI IF(2020)= 6.222。
杨银涛目前从事图神经网络、文本分类的研究工作。
本文提出了一个新的基于图的文本分类模型,名为CGA2TC,将对比学习与自适应增强策略引入到获得更鲁棒的节点表示中。首先,我们探索词的共现性和文档-词的关系来构建一个文本图。然后,我们为有噪声的文本图设计了一个自适应增强策略,以产生两个对比视图,有效地解决噪声问题并保留其基本结构。具体来说,我们在文本图的拓扑结构上设计了基于噪声和基于节点中心性的增强策略,以干扰不重要的连接,从而突出相对重要的边。对于有标签的节点,我们将具有相同标签的节点作为多个正样本,并将其分配给锚节点,同时,我们对无标签的节点采用一致性训练来约束模型的预测。最后,为了减少对比学习的资源消耗,我们采用了随机抽样的方法来选择一些节点来计算对比损失。在几个基准数据集上的实验结果可以证明CGA2TC在文本分类任务上的有效性。