徐昊教授和Fausto Giunchiglia教授联合指导的2019级博士研究生田明杰同学的论文“Enhancing Ontology Translation through Cross-Lingual Agreement”近日被IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP)会议接收。本篇论文的通讯作者为徐昊教授,合作者包括Fausto Giunchiglia院士、吉林大学人工智能学院的博士研究生宋瑞同学等。
会议简介:ICASSP是信号处理领域的重要国际会议,由IEEE信号处理协会(SPS)主办,每年举办一次。ICASSP 2023将于2023年6月4日至10日在希腊罗德岛举办。
会议类别:CCF B类会议
会议时间:4th-10th June 2023, Rhodes Island, Greece Island
第一作者:田明杰
论文题目:Enhancing Ontology Translation through Cross-Lingual Agreement
论文概述:本体为数据资源提供了组织结构,其为反映特定领域概念提供了由关键字短语组成的受控词汇表。本体支持许多自然语言处理的应用,包括信息抽取、语义搜索、自然语言生成等。为了实现跨语言的知识共享,通常只用英语表示的本体必须翻译成不同的语言。由于本体论的词汇极其专业且缺乏上下文信息,因此有必要构建一个特定领域的翻译系统。多语言信息访问的研究通常集中在数字资源库的实际内容上,往往忽略了相关本体中显式嵌入的重要知识。本文通过跨语言一致性来缓解上述问题,首先提出一种本体标签表示方法,通过最小化源语言与目标语言之间的语义距离来构建一致性约束对象。其次通过融合了对抗学习方法减少微调过程中翻译模型生成的假设与真实翻译之间的差异。最后,将一致性建模策略融入到翻译解码阶段指导翻译候选的生成。实验结果表明,该方法在基准数据集上较基线方法取得了显著的性能提升。进一步的分析证明了本文提出的跨语言一致性模块可以有效学习本体标签的特征表示以及跨语言对齐信号。