人工智能学院王鑫副教授指导2023级硕士研究生沈旭同学和2021级博士研究生王一立同学的论文"Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models"被CCF-A类会议KDD'2024会议接收。KDD,全称ACM SIGKDD Conference on Knowledge Discovery and Data Mining,是数据挖掘领域的CCF-A类国际顶级学术会议,是公认的数据挖掘领域最具影响力的国际会议之一。本工作和Griffith University Shirui Pan Full Professor合作完成。
论文题目:Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models
论文作者:沈旭,王一立(共同第一作者)
指导教师:王鑫
收录会议:30th SIGKDD Conference on Knowledge Discovery and Data Mining (Research track)
期刊类别:CCF-A
论文概述:
尽管分子表示学习已经取得了引人注目的进展,但其有效性是基于封闭世界假设,即训练和测试图来自相同分布。开放世界的测试数据集经常混有分布外(OOD)的例子,部署的模型将很难做出准确的预测。本文提出采用一种基于扩散模型的框架来检测OOD分子,比较输入分子和重建图之间的相似性。然而,将这个普通框架扩展到实际检测应用仍然受到两个重大挑战的限制。首先,流行的基于欧氏距离的相似性度量方法未能考虑复杂的图结构; 其次,涉及迭代去噪步骤的生成模型非常耗时,特别是当它在巨大的分子数据集上运行时。为了解决这些挑战,我们的研究提出了一个全新的框架:PGR-MOOD。具体而言,PGR-MOOD基于3个创新:i)根据输入和重构分子的离散边和连续节点特征,综合量化其匹配程度;ii)一个全新的图生成器,以构建一个符合ID分布但不符合OOD分布的原型图列表;iii)一个高效和可扩展的OOD检测器,用于比较测试样本和预先构建的原型图之间的相似性。广泛的实验证明所提方法的优越性。