ACTA Scientiarum Naturalium Universitatis Pekinensis
基于中英文可比较语料的中文零指代消解
杨紫怡 贡正仙 孔芳† 周国栋
苏州大学计算机科学与技术学院, 自然语言处理实验室, 苏州 215006; † 通信作者, E-mail: kongfang@suda.edu.cn
摘要 针对中文篇章中的零指代问题, 提出一种基于中英文可比较语料进行中文零指代识别和消解的方法,并提出英文对等句的概念。利用对等句, 重新定义句子间隔, 并引入双语词对齐特征。在基准平台基础上,从零指代项识别和零指代项消解两个方面进行研究。在 Ontonotes5.0 语料上的实验结果表明, 与目前性能最好的系统相比, 新提出的基于中英对等语料的中文零指代方法取得更好的性能。关键词 中文零指代; 双语; 对等句; 识别; 消解中图分类号 TP391