助词“的”用法自动识别研究

刘秋慧1 张坤丽1,† 许鸿飞1 俞士汶2 昝红英1

ACTA Scientiarum Naturalium Universitatis Pekinensis - - Contents -

北京大学学报(自然科学版) 第 54 卷 第3 期 2018 年 5 月Acta Scientiarum Naturalium Universitatis Pekinensis, Vol. 54, No. 3 (May 2018) doi: 10.13209/j.0479-8023.2017.167

1. 郑州大学信息工程学院 郑州 450001; 2. 北京大学计算语言学教育部重点实验室, 北京 100871; † 通信作者, E-mail: ieklzhang@zzu.edu.cn

摘要 在“三位一体”虚词用法知识库的基础上, 分别采用基于规则、基于 CRF 模型和神经网络模型的门循环单元, 对助词“的”用法进行自动识别, 识别的准确率分别为 34.4%, 77.5%和 81.3%。在对助词“的”用法进行分析的基础上, 合并了部分用法, 并采用 CRF 模型和神经网络模型进行粗粒度用法识别, 准确率分别达到 81.8%和 84.5%, 得到较明显的提高。期望识别结果可以应用于其他自然语言处理任务中。关键词 “的”; 门循环单元; 规则; CRF中图分类号 TP391

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.