融合多模型与高置信度词典的事件线索检测

陈亚东 洪宇† 王潇斌 杨雪蓉 姚建民 朱巧明

ACTA Scientiarum Naturalium Universitatis Pekinensis - - 北京大学学报 自 然 科 学 版) - 陈亚东洪宇 王潇斌 等

苏州大学江苏省计算机信息处理重点实验室, 苏州 215006; † 通信作者, E-mail: tianxianer@gmail.com

摘要 提出一种融合多模型和高置信度词典的事件线索识别方法, 将高置信度词典特征分别加入最大熵模型和条件随机场模型, 然后融合两个模型的结果, 旨在提高触发词识别的召回率和整体性能。针对事件真伪性识别任务, 进一步考察否定词或不确定词与触发词的物理位置距离和依存路径距离等特征, 提高事件真伪性识别的性能。实验结果显示, 针对触发词识别和事件真伪性识别任务, 与仅使用最大熵模型相比, 所提出的融合多模型与高置信度词典的方法能够提高触发词识别的性能6.43%, 提高事件真伪性识别的性能1.69%。关键词 事件线索检测; 最大熵模型; 条件随机模型; 高置信度词典中图分类号 TP391

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.