2018级博士研究生杨志伟在科研上取得新进展

发布时间:2021-09-02 点击:

  常毅教授指导的2018级博士研究生杨志伟同学的论文"HiTRANS: A Hierarchical Transformer Network for Nested Named Entity Recognition"  被国际会议EMNLP 2021(清华推荐A类,CCF B类)接收为长文。本篇论文与香港浸会大学马晶助理教授合作完成。

  会议简介:EMNLP(Conference on Empirical Methods in Natural Language Processing)是计算语言学和自然语言处理领域的顶级国际会议,由ACL SIGDAT(语言学数据特殊兴趣小组)主办,每年举办一次,Google Scholar计算语言学刊物指标中排名第二。EMNLP 2021将于2021年11月07日至11日在多米尼加共和国蓬塔卡纳及在线会议的形式同时举办。

会议类别:清华推荐A类,CCF B类会议

会议时间:7th–11th November 2021, Punta Cana, Dominican Republic.

第一作者:杨志伟

论文题目:HiTRANS: A Hierarchical Transformer Network for Nested Named Entity Recognition

论文概述:目前嵌套实体识别(NNER)任务主要包含嵌套实体边界检测和实体类别标注两个子任务。本研究通过探索信息抽取中不同实体之间的语义依赖关系,创新性提出了一种面向嵌套命名实体识别任务的HiTRANS网络,将复杂的NNER建模成多层的传统实体识别问题,既改善实体边界划分又极大降低了嵌套命名实体识别任务的复杂度。同时,利用Transformer中的多头注意力机制聚合上下文信息以增强不同层实体的表示学习。在此基础上,通过分层标注预测实体类别,有助于实体识别并缓解误差传播。实验结果表明,我们的方法在多个嵌套实体数据集上均取得了更好的性能,能够有效的解决嵌套实体识别问题,提供高质量的基础知识。