人工智能学院2022级博士研究生叶航廷关于深度表格表示校正器的研究成果,已被人工智能领域国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》(TPAMI)接收。TPAMI作为人工智能领域最具影响力的期刊之一,在全球学术界享有盛誉。
论文标题:Deep Tabular Representation Corrector
第一作者:叶航廷(2022级直博生)
指导教师:郭丹丹、常毅
收录期刊:IEEE Transactions on Pattern Analysis and Machine Intelligence
期刊类别:CCF-A
论文概述:
表格数据在医疗健康、工程、金融等诸多现实领域一直扮演着至关重要的角色。深度学习的近期成功催生了大量基于深度网络的表格学习方法。现有深度表格机器学习方法主要遵循两种范式:in-learning与pre-learning。in-learning需从头训练网络或施加额外约束以调整表征,但这种方式需同时处理多任务而增加学习难度;而pre-learning通过设计若干预训练任务再进行任务特定微调,但需要大量先验知识且训练成本较高。本文提出了一种新颖的深度表格表示校正器TRC,该工具能以模型无关的方式增强任何已训练深度表格模型的表征能力,且不修改其原始参数。具体而言,针对阻碍预测效果的表征偏移与表征冗余问题,我们提出两项核心任务:(1)表格表示重估——通过训练偏移估计器计算表格表征的固有偏移量并予以消除,从而实现表征重估;(2)表征空间映射——通过坐标估计器将重估后的表征转换至轻量级嵌入向量空间,在保留关键预测信息的同时最大限度减少冗余。这两项任务协同作用,可在不改动原模型的前提下有效提升深度表格模型的表征质量,具有显著效率优势。最终,我们在多个主流表格基准数据集上对结合TRC的先进深度表格机器学习模型进行了广泛实验,结果均显示出持续优异的性能。
