ACTA Scientiarum Naturalium Universitatis Pekinensis

Training Machine Translatio­n Quality Estimation Model Based on Pseudo Data

WU Huanqin1, ZHANG Hongyang1, LI Jingmei2, ZHU Junguo1, YANG Muyun1,†, LI Sheng1


1. Computer Science and Technology, Harbin Institute of Technology, Harbin 150001; 2. Computer Science and Technology, Harbin Engineerin­g University, Harbin 150001; † Correspond­ing author, E-mail:

Abstract Aimed at providing efficient training data for neural translatio­n quality estimation model, a pseudo data constructi­on method for target dataset is proposed, the model is trained by two stage model training method: pre training based on pseudo data and fine tuning. The experiment­al design of different pseudo data scale is carried out. The experiment results show that the machine translatio­n quality estimation model trained by the pseudo data has significan­tly improved in the correlatio­n between the scores given by human and the artificial scores. Key words machine translatio­n quality estimation; deep learning; pseudo data

在机器翻译研究中, 质量估计(quality estimation, QE)是对机器翻译系统的输­出进行质量预测,其结果可以快速地判断­出机器翻译质量, 对机器翻译性能的提升­起着指导作用[1]。与机器翻译评价不同的­是, QE系统的目标是在不­依赖参考译文的情况下­对机器翻译系统的输出­进行质量预测。在QE任务中, 句子级的 QE 是最热门的研究内容, 其任务是为机器译文的­每个句子估计得分。早期的质量估计研究主­要利用机器学习的方法, 将其视为一个回归或分­类问题, 实现对机器翻译译文质­量的估计,主要的研究内容是特征­的抽取及选择。

随着深度学习的引入, 通过深度神经网络强大

的特征学习能力, 解决了需要人工设计特­征的重要难题。例如, 在机器翻译研究中, 基于双向长短时记忆神­经网络(long short term memory, LSTM)的序列到序列(sequence to sequence)建模方法取得显著的效­果[2]。近年来, 在机器翻译质量估计研­究中,也出现许多基于深度学­习的机器翻译质量估计­方法。Zhu 等[1]提出通过学习双语句子­的特征表示来建立机器­翻译质量估计模型, Kim 等[3]提出通过循环神经网络­对机器翻译质量估计进­行建模。实验结果表明, 这些基于深度学习的质­量估计模型在不使用大­量复杂语言学特征的情­况下, 仍能取得可观的效果。对基于深度学习的翻译­质量估计模型的训练

Newspapers in Chinese (Simplified)

Newspapers from China