人工智能学院2023级博士研究生李晋南的论文被ACL'2025接收

发布时间:2025-05-16 点击:

ACL 2025 (The 63rd Annual Meeting of the Association for Computational Linguistics)将于2025727日至81日于奥地利维也纳举行。ACL是自然语言处理领域最具影响力的国际会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。该会议每年举办一次,由国际计算语言学学会协会(The Association for Computational Linguistics)主办。


论文题目: StructFlowBench: A Structured Flow Benchmark for Multi-turn Instruction Following

第一作者:李晋南(2023级博士)

收录会议:ACL 2025 Findings (CCF-A)

指导教师:常毅、邬渊、王悦


论文概述:多轮对话指令遵循能力是大语言模型(LLMs)在真实世界应用中的核心能力之一。现有评估基准主要关注细粒度的约束满足和特定领域的能力评估,却忽视了区分多轮对话与单轮交互的关键——对话轮次之间的结构性依赖关系。这种结构依赖不仅体现了用户意图,也为指令遵循的评估提供了除约束满足之外的第二维度。为填补这一空白,我们提出了 StructFlowBench,一个具有结构流程建模能力的多轮指令遵循评估评测基准。该基准创新性地定义了一个结构流程框架,包括六种基本的多轮对话轮次间关系,不仅为模型评估引入了新的结构性约束,还可作为生成参数,用于构建贴合特定场景的定制对话数据。我们采用已有的大模型自动评估方法,对13个主流的开源与闭源大模型进行了系统性评估。实验结果揭示了当前模型在理解多轮对话结构方面存在显著不足。