ACTA Scientiarum Naturalium Universitatis Pekinensis
基于发音特征的发音偏误趋势检测研究
屈乐园 解焱陆† 张劲松
北京语言大学信息科学学院, 北京 100083; † 通信作者, E-mail: xieyanlu@blcu.edu.cn
摘要 为了提升计算机辅助发音训练(CAPT)系统中发音偏误趋势(PET)的检测效果, 确保反馈信息的准确性与有效性, 提出一种基于对数似然比的发音特征方法。该方法将多个基于深度神经网络的发音特征提取器用于生成帧级别的对数似然比, 然后将对数似然比组成的发音特征用于PET的检测, 为学习者提供发音位置和发音方法的正音信息。实验结果表明, 发音特征对PET的检测效果优于常用声学特征(MFCC, Plp和fbank),当发音特征与MFCC特征相结合时, 可以进一步提升性能, 达到错误接受率为5.0%, 错误拒绝率为30.8%, 诊断正确率为89.8%的检测效果。关键词 发音特征; 发音偏误趋势; 计算机辅助发音训练; 对数似然比中图分类号 TP391; H193