人工智能学院2023级博士研究生仲海锋的论文被ICCV 2025接收

发布时间:2025-06-27 点击:

ICCV 2025(IEEE/CVF International Conference on Computer Vision)将于2025年10月19日至23日在美国夏威夷举行。ICCV是计算机视觉领域最具影响力的国际顶级会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。该会议每两年举办一次,由美国电气和电子工程师学会(IEEE)与计算机视觉基金会(CVF)联合主办。


论文题目:AMDANet: Attention-Driven Multi-Perspective Discrepancy Alignment for RGB-Infrared Image Fusion and Segmentation

第一作者:仲海锋(2023级博士研究生)

收录会议:ICCV 2025 (CCF-A类)

通讯作者:高一星


论文概述:

多模态语义分割的难点在于如何在视觉特征差异较大的情况下建立语义一致且易于分割的多模态融合特征。现有方法通常依赖构建跨模态自注意融合框架或引入多模态融合损失来建立语义一致的融合特征。然而,这些方法往往忽略了特征融合过程中不同模态之间视觉特征差异所带来的挑战。为了实现精确的多模态分割,我们提出了一种注意力驱动的多模态差异对齐网络(AMDANet)。 AMDANet通过权重重分配动态抑制非语义一致性特征的显著性,并利用低权重特征作为辅助线索来进一步减轻模态之间的特征差异,从而实现多模态特征的语义对齐。此外,为了简化特征对齐过程,我们提出了一种语义一致性推理机制来揭示网络对特定模态的固有偏置,从而从基础层面压缩跨模态非语义一致性特征的差异。在FMB、MFNet和PST900数据集上的实验表明,与目前最先进的多模态分割方法相比,我们的AMDANet分别将mIoU显著提高了3.6%、3.0%和1.6%,证明了其有效性与优越性。