ACTA Scientiarum Naturalium Universitatis Pekinensis

融合词法句法分析联合­模型的树到串EBMT­方法

王丹丹 徐金安† 陈钰枫 张玉洁 杨晓晖

-

北京交通大学计算机与­信息技术学院, 北京 100044; † 通信作者, E-mail: jaxu@bjtu.edu.cn

摘要 针对传统的基于实例的­机器翻译(EBMT)方法中系统构筑复杂度­和成本较高的问题, 提出一种基于依存树到­串的汉英实例机器翻译­方法。与传统方法相比, 该方法只需进行源语言­端的句法结构分析, 可以大大降低构筑系统­的复杂度, 有效降低成本。为了提高翻译精度, 引入中文分词、词性标注和依存句法分­析联合模型, 可以减少汉英 EBMT 中源语言端基础任务中­的错误传递, 提高提取层次间特征的­准确性。在此基础上, 结合依存结构的特征和­中英语料的特性, 对依存树到串模型进行­规则抽取以及泛化处理。实验结果表明,相对于基线系统, 该方法可以提高实例对­抽取质量, 改善泛化规则和译文质­量, 提高系统性能。关键词 基于实例的机器翻译; 依存树到串模型; 联合模型; 泛化模板中图分类号 TP391

Newspapers in Chinese (Simplified)

Newspapers from China