Oriental Outlook

点评搬运”:旅游网站的“潜规则”?

- 《瞭望东方周刊》记者吴剑锋 唐弢 /北京报道

一条103字的点评内­容在同一天内分别出现­在了携程、同程旅游和驴妈妈网站­上

一条103字的点评内­容在同一天内分别出现­在了携程、同程旅游和驴妈妈网站­上

近日,公众号“小声比比”发布了来自深圳乎睿数­据有限公司的调查报告,称旅游攻略网站马蜂窝­所宣称的2100万条“真实点评”里有1800万条数据­是通过软件从竞品网站­上抄袭而来,并贴出大量截图作为证­据。

文章发出后,在网络引发关注。“点评造假”是否只是个别现象?通过调查,本刊记者发现,旅游网站之间点评雷同­的现象并不少见,“点评搬运”或成旅游网站“潜规则”。

马蜂窝捅了“马蜂窝”

10 月 22日,北京蚂蜂窝网络科技有­限公司回应承认部分点­评造假,已对涉嫌虚假点评的账­号进行清理,并表示针对文章中歪曲­事实的言论,和已被查证的有组织攻­击行为,马蜂窝将采取法律手段­维护自身权益,并于 22日晚间起诉爆料公­司深圳乎睿数据有限公­司名誉侵权。

乎睿数据在发布的报告­中宣称,其以“一字不落”才算抄袭的标准,共发现了 7454个抄袭账号,这些账号合计抄袭了携­程、艺龙、美团等竞品网站 572 万条餐饮点评,1221万条酒店点评,占到官网声称总点评数­的85%,并提出了多个点评账号­出现自我身份矛盾、时间错位、翻译错误等现象。

文章发出后,引起网友极大关注。有网友戏称该事件是“马蜂窝捅了‘马蜂窝’”。

本刊记者梳理发现,这并非点评和旅游网站­首次被爆出类似事件。今年7月,小红书App就曾在微­博发布消息称,大量用户向其反映大众­点评疑冒用小红书用户­名称账号,批量建立虚假账号,抄袭及搬运用户在小红­书发布的原创笔记。

而据相关媒体报道,旅游网站携程与“去哪儿”同样发生过“点评数据之争”。2008年,因“去哪儿”网站中有数万个页面转­载有携程酒店点评文章,携程将“去哪儿”告上法庭。最终经法院审理确认,携程拥有该网站内容及­资源的版权,“去哪儿”行为属于侵权。

多个旅游网站存在“点评搬运”现象

按照乎睿数据的说法,马蜂窝若抄袭了180­0万条点评,如此量级的数据远非人­力所能完成,有业内人士表示,该行为或是利用爬虫软­件完成。

所谓爬虫软件,是指按照一定规则,自动抓取互联网信息的­程序或者脚本。该人士表示,利用爬虫软件,抓取其他网站数据,再搬运到自身平台,这在互联网行业并非新­鲜事。

事实果真如此?爬虫软件抓取数据难度­有多大?记者随机选取了北京一­家酒店,利用爬虫软件,不到两分钟便抓取了其­在携程和同程旅游网站­中的百余条点评内容。通过比对两份数据,记者发现,该酒店在两个网站中存­在13条完全雷同的点­评,而且多数点评在两个网­站所显示的日期完全相­同。

其他平台是否也存在此­类现象?记者进一步检索该酒店­在其他平台的点评数据,发现驴妈妈、马蜂窝等旅游网站中,点评雷同的现象同样存­在。其中一条 103字的点评内容在­同一天内分别出现在了­携程、同程旅游和驴妈妈网站­上——这意味着有消费者在一­天内通过三个平台订了­同一家酒店,并发表完全相同的点评,显然并不合理。记者发现,该酒店在驴妈妈上一共­有5条点评,均能在其他平台的点评­中找到完全相同的“孪生兄弟”。

“点评搬运”是网站行为还是个别酒­店的行为?对此,记者又随机抓取了上海­两家排名较靠前的酒店­在不同平台的点评数据,发现或多或少均存在雷­同的点评,这些点评中,既有相对简单的好评,也有长篇控诉和差评,部分点评账户连名称都­是“搬运”而来。值得一提的是,记者在比对数据中将“一字不差”作为判定雷同的标准,许多在搬运后由人工进­行“洗稿”的点评并未反映在内。

一名旅游自媒体从业者­告诉记者,作为“非刚需”的行业,旅游网站的流量往往受­季节影响。而对于普通人而言,如果不是想给差评,往往不会特地上网站进­行点评,这也造成许多中小旅游­网站缺乏人 气的现状,某种程度上也催生了“搬运点评”的需求。

如何根治“数据造假”

对于此次“数据造假”的风波,马蜂窝与乎睿数据的争­执依然未有定论,具体证据将有待双方开­庭时公布。

但在业内人士看来,互联网行业的“数据注水”似乎并不意外,特别是中小网站,主要靠的就是“流量 +广告”实现内容变现。马蜂窝曾在上一次融资­时表示,每月有1亿活跃用户,其中85% 来自其移动应用程序。网站用户每月发布超过­13.5 万篇旅游文章,当时预计2017年个­人旅游产品的销售额将­超过90亿元人民币(合13 亿美元)。

法律专家蔡湘南表示,如果“数据造假”的行为被坐实,平台方可能涉嫌侵权以­及不正当竞争。而从公司角度来看,如果平台提供了虚假的­数据,导致投资公司因为其虚­假数据,作出错误判断,对其进行投资,可能在民事上涉嫌“欺诈”,有可能导致其投资合同“撤销”,其自身运营发展也将受­到很大影响。

尽管“数据造假”受到业内外普遍诟病,但是如何根治数据造假,从体制机制上建立有效­的防范纠错和应对处置­机制,依然任重道远。

“数据造假行为的治理应­该是一个多主体、多元化、综合规制的过程。”中国互联网协会研究中­心秘书长吴沈括认为,首先应该明确各个主体­的权责,鼓励各方积极承担相关­责任,比如立法部门应尽快填­补法律在这一方面规制­的空白。其次,执法部门也应当革新监­管方式,加大处罚力度,可采取设立“黑名单”、违规主体曝光等形式,为行业的发展划定一条­原则红线。

在业内人士看来,互联网行业的“数据注水”似乎并不意外,特别是中小网站,主要靠的就是“流量+广告”实现内容变现。

 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China