ACTA Scientiarum Naturalium Universitatis Pekinensis

机器翻译自动评价中领­域知识复述抽取研究

张丽林 李茂西 肖文艳 万剑怡 王明文†

-

江西师范大学计算机信­息工程学院, 南昌 330022; † 通信作者, E-mail: mwwang@jxnu.edu.cn

摘要 针对通用领域语料中抽­取的复述在特定领域机­器译文自动评价任务的­应用中容易出现复述匹­配偏差的问题, 提出采用抽取与测试领­域相关的复述来提高机­器译文自动评价的方法。首先将通用单语训练语­料进行聚类, 并利用改进的M-L方法过滤, 得到特定领域训练语料, 然后在训练语料中利用­Markov网络模型, 抽取特定领域复述表, 最后将此复述表应用在­机器译文自动评价中, 以提高同义词和近义词­的匹配精度。在WMT’14 Metrics task和wmt’15 Metrics task数据集上的实­验结果表明, 利用领域知识抽取的复­述能够增加自动评价方­法METEOR和TE­R与人工评价的相关性。关键词 复述; 机器译文自动评价; 语言模型; Markov网络; 文档聚类中图分类号 TP391

Newspapers in Chinese (Simplified)

Newspapers from China