2019级博士研究生迟杨在NLP与古文字学交叉研究方向取得新进展

发布时间:2022-03-10 点击:

徐昊教授和Fausto Giunchiglia教授指导的2019级博士研究生迟杨同学的论文 “ZiNet: Linking Chinese Characters Spanning Three Thousand Years”被国际会议ACL 2022(CCF A类会议,清华推荐A)接收。

迟杨本科就读于吉林大学软件学院,2016年保送到计算机科学与技术学院,进入徐昊老师HAI(Human-Centered AI)实验室读研,2019年于人工智能学院攻读博士学位。本篇论文的通讯作者为徐昊老师,合作者包括Fausto Giunchiglia老师、吉林大学考古学院教授李春桃老师,意大利特伦托大学计算机科学系博士研究生史大千、刁晓蕾同学。

会议简介:ACL是自然语言处理与计算语言学领域最高级别的学术会议,由国际计算语言学协会举办,每年一届。

会议名称:60th Annual Meeting of the Association for Computational Linguistics (ACL 2022)

会议类别:CCF A类会议,清华推荐A类

会议时间:22nd - 27th May 2022, Dublin, Ireland

会议地点:爱尔兰——都柏林 + 在线

第一作者:迟杨

论文题目:ZiNet: Linking Chinese Characters Spanning Three Thousand Years

论文概述:

现代汉字由3500年前的甲骨文演变而来,到目前为止,考古学家们已发现数以万计的古文字字形,这些字形必须被专家考释,才能与现代汉字关联,从而解读遥远的历史文献。古文字学家在研究中经常需要将某一古代汉字与整个历史时期已知的相似汉字进行比较,这不可避免地受到人类记忆和经验的局限。为了帮助专家查找字形相似的汉字,本文介绍了ZiNet,这是第一个描述汉字之间关系和演变的历时知识库,同时,基于ZiNet中的语义知识,本文第一次提出了一种古汉字字形相似性度量方法,该方法可以捕捉可能在起源或语义上相关的相似字形对。结果表明,方法为文字对样本给出的相似度分数与人类专家打分存在很强的正相关关系。最后,本文进行定性分析并讨论潜在的应用前景。