庆祝吉林大学建校80周年暨2026年春季学期人工智能前沿讲座第2讲——吉林大学人工智能学院马畅翼副教授学术报告

发布时间:2026-04-14 点击:

报告题目:相似度检索和相似度矩阵校准

报告人:马畅翼副教授 吉林大学人工智能学院

报告摘要:

在图像检索、文本检索和自然语言处理等领域,大规模相似度检索都扮演着核心角色。然而现在中的数据不完整,如查询信息不完整、数据采集失误、用户行为缺失等,都导致数据缺失现象普遍存在。而这些数据缺失直接导致了相似度矩阵不准确进而影响相似度检索的准确率。而如何从不准确的相似性矩阵中,快速、精准地校准出真实相似度,成为当前工业界和学术界亟待解决的关键难题。本次报告将聚焦于相似度矩阵校准(Similarity Matrix Calibration, SMC)问题,旨在从这些初始的不准确的相似度矩阵,校准相似度误差,从而使的校准的相似度矩阵更接近数据完整时的真实的相似度矩阵。SMC的相关研究利用相似度矩阵半正定属性和低秩属性,设计高效的算法。具体来讲,我们引入半正定矩阵特有的科列斯基分解(Cholesky Factorization),学习较小的分解矩阵代替原始大规模的相似度矩阵。为确保算法的理论最优结果, 我们针对低秩属性设计了特定的正则项,以确保模型在能达到最优相似度校准结果。 基于此框架,我们进一步探索了如何有效整合辅助特征信息,提升相似度矩阵校准效果。在本次报告的最后,将简要介绍如何将相似度矩阵校准的研究成果扩展到噪声标签学习领域以及相关的研究方法如何应用到的大模型相关研究领域。

报告人简介:

马畅翼,吉林大学人工智能学院准聘副教授,博士生导师。2022 年获香港中文大学博士学位,获香港中文大学(深圳)校长优秀博士毕业生荣誉。 研究方向包括:机器学习、相似度检索、矩阵补全、连续学习等。在机器学习、数据挖掘顶级会议和期刊发表多篇高水平论文。以第一作者荣获2021年ACM International Conference on Information & Knowledge Management(CIKM 2021, CCF B) 会议最佳短文提名奖。

报告时间:2026年4月16日 13:30-15:10

报告地点:前卫校区-正新楼四楼学生教室