人工智能学院常毅教授指导的2022级直博生叶航廷同学的论文 "UADB: Unsupervised Anomaly Detection Booster"被CCF-A类会议(ICDE 2023)接收。叶航廷本科就读于吉林大学唐敖庆理科试验班,从大学四年级起开始接受常毅老师与微软亚洲研究院的联合指导,2022年保送到我院跟随常毅教授继续攻读直博研究生,从事机器学习与数据挖掘领域的研究工作。本工作与伊利诺伊大学香槟分校博士研究生Zhining Liu同学以及微软亚洲研究院Wei Cao、Jiang Bian博士合作完成。
会议简介:ICDE(International Conference on Data Engineering)是数据库领域的顶级国际会议,主要关注数据工程、数据管理以及相关技术的最新研究成果和发展动态。该会议一年举办一次,由国际数据工程协会 (International Association for Data Engineering, IADE) 主办。
会议类别:CCF-A类会议
会议时间:April 3 – 7, 2023,Anaheim, California, USA
第一作者:叶航廷
论文题目:UADB: Unsupervised Anomaly Detection Booster
论文概述:无监督异常检测(UAD)是一个关键且具有广泛实际应用的数据挖掘问题。由于完全缺乏监督信号,UAD方法通常依赖于隐含假设来检测异常。然而,现实世界的数据是复杂的,在不同领域有很大的差异。没有一个假设可以描述这样的复杂性并且在所有情况下都是有效的,最新的异常检测研究也证实了该结论。基于以上观察,我们认为UAD的研究方向不应该是去寻找一个通用的假设,而应该是寻求设计一个通用的UAD Booster(UADB),使任何UAD模型都具有适应不同数据的能力。由于现有UAD方法采用的是异质的模型结构和假设,因此这是一项具有挑战性的任务。为了实现这一目标,我们深入研究UAD问题并发现,与正常数据相比,异常数据(1)在特征空间中缺乏明显的结构/模式,因此(2)难以被没有适当假设的模型学习,最终导致(3)不同学习者之间的高方差。鉴于这些发现,本文提出:(1)将源UAD模型的知识蒸馏到一个不具有数据假设的模仿学习器(助推器)中;(2)利用它们之间的差异来进行自动校正; 从而(3)使助推器超越原始UAD模型。 我们使用神经网络作为助推器,因为它具有强大的表征能力和能够进行灵活的后期调整的能力。我们在超过80个表格数据集上进行了大量实验,结果证明了UADB的有效性。