游客微博主题情感分析方法比较研究

刘思叶 田原 冯雨宁 等

ACTA Scientiarum Naturalium Universitatis Pekinensis - - 北京大学学报 -

北京大学遥感与地理信息系统研究所, 北京 100871; † 通信作者, E-mail: tianyuanpku@pku.edu.cn

摘要 针对饮食、娱乐、购物、景观、交通和住宿6个旅游主题, 基于机器学习方法, 开展游客微博主题情感分析方法比较研究。以人工标注的53140条赴日游客微博为数据基础, 应用两种机器学习模型开展建模实验,并分析不同特征对建模效果的影响。实验结果显示, 两种模型的建模效果良好, 适用于游客微博主题情感分析, 其中最大熵模型效果略优于支持向量机。研究还表明, 在词特征的基础上引入表情符号和主题词进行特征扩展, 可以提高模型的建模效果。关键词 主题情感分析; 游客微博; 最大熵模型; 支持向量机中图分类号 F590

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.