大数据技术与国际舆情研判

International Communications - - 重点话题 - 聂书江中国政法大学光明新闻传播学院

国际舆情研判是指对国际舆论场中的舆情进行价值和趋势的一种分析与判断过程,主要由两部分构成:一是对国际舆论场中舆情进行日常性、持续性的跟踪、,收集形成舆情库,进而提出报告;二是针对具体的国际危机或议题的舆情进行针对性研判,形成报告。前者具有系统性、稳定性和长期性,后者具有临时性、突发性和专题性特征。

国际舆情研判是否准确不但影响国际危机管理的水平,而且也影响国家决策的制定与执行,在国际危机管理的过程中具有非常重要的作用。国际危机公关坚持“决策未出,研判先行”就是对国际舆情研判的生动说明。而在传统意义上,国际舆情研判主要是通过人工浏览、文档精选或案例库比对等方法,,不过 这些方法能够奏效的一个前提是数据库的可控性或者数据体量的可计算性。但是,在大数据时代,信息体量的几何指数级增加意味着建立在可控假设的舆情研判方法难以解决大数据舆情状况,,因此 如何在大数据时代提升国际舆情的研判质量就成为学界和业界思考的问题。

一、大数据时代传统舆情研判的不足

20世纪90年代,面对纷繁复杂的国际舆论场,为了保证政策执行的准确性,我国国际舆情研判得到长足发展,当时采取的主要手段是人海浏览法,,即 通过对国际主流报刊和广播进行人工查阅以了解该国舆情的发展方向,然后撰写报告,如国外动态参考之类。21世纪初,随着信息技术的发展,国际舆情研判手段发展到多文档精选法和模板因子法。,如今 基于网络技术发展,又发展出关键词搜索法、网络实验法和数据库比对法。以上各种方法,在舆情研判的工作中曾经发挥着重要的作用,也取得了一定的成效。,但是 新的大数据挖掘技术的发展,以上几种方法在舆情研判上的不足逐渐暴露出来。

1.样本代表性不足。传统舆情研判的数据基础思想是样本的随机性采集,但这些样本并不是全样本,而是 小样本,小数据量。之所以如此,一方面是受制于统计工具,另一方面是因为随机性统计方法认为,采样分析的精确性随着采样随机性的增加而大幅提高,这种提高跟样本数量关系不大,也就是,样本随机性比样本数量更加重要。,然而 祝建华教授在一次讨论中明确表示,如果抽样的对象过于复杂,比如大数据,,那么 人们根本找不到一个最优抽样的标准。一旦随机性出现偏差,分析结果就会相去甚远。2016年,美国总统大选,不但美国相关机构预测失败,而且我国的统计机构也预测认为候选人希拉里会获胜,日本统计机构甚至认为希拉里大胜,从而建议首相提前结好希拉里。,但是 印度的人工智能系统MogIA却通过对Google、Facebook、Twitter等平台上2000万个数据点分析后认为,特朗普能够当选美国总统,于是我们看到,当特朗普当选后,日本首相不被待见,而印度总理却很受美国总统特朗普欢迎。这一事例说明,小样本已经不能够满足大数据时代的舆情研判,如果还基于小样本提供舆情研判,极易出现失误。

2.缺乏包容性。在信息缺乏时代,信息的精确性就意味着研判的精确性。人们不但执迷于获取精确的信息,而且也为如何消除噪音而苦恼。在线性传播模式中,噪音是一个影响传播效果的主要因素,传播学者为此制定出很多降噪的策略,如设备降噪、传播重复、扩大音量等。但是,信息爆炸的时代,噪音与数据并存,人们获得有用数据的同时,也就意味着噪音的获得,“我们掌握的数据库越来越全面,它不再只包括我们手头现象的一点点可怜的数据,而是包括了与这些现象相关的大量甚至全部数据。我们不再需要那么担心某个数据点对整套分析的不利影响。我们要做的就是要接受这些纷繁的数据并从中受益,

①而不是以高昂的代价消除所有的不确定性。” 但是,小样本为了精确性而排斥这些数据。

3.效率低下。无论是人工浏览法还是文档精选法,它们不但耗费巨大的人力物力,而且在面对危机事件时,也不能立即总结出可行的报告,其效率低下的缺点暴露无

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.