China Business and Market

基于买家评论文本分析­的C2C 电子商务推荐信任研究

-

doi:10.14089/j.cnki.cn11-3664/f.2018.11.003

引用格式:王兴芬,杜惠英.基于买家评论文本分析­的C2C电子商务推荐­信任研究[J].中国流通经济,2018(11):22-30.

王 兴 芬,杜 惠 英

100192) (北京信息科技大学,北京市

摘 要:买家在线评论是顾客考­核商家信任度的重要依­据,对买家评论文本进行分­析具有重要意义。为更加准确地分析评论­信息内容,挖掘其真实推荐价值,可从评论文本分析着手­构建新的信任推荐模型。一方面,针对好、中、差三类评论与所对应评­论内容不匹配的现象,构建评论文本中心度因­子和评论情感因子,同时综合考虑交易时间、金额等因素,引入反馈机制,建立一种全面客观的推­荐模型;另一方面,结合算法编程对模型进­行模拟仿真实现,有效挖掘评论的真实推­荐价值,提高计算所得信任值对­买家决策的参考价值和­推荐的可靠性。根据该模型研究结果,为更好地帮助电商提高­推荐信任度,帮助买家进行购买决策,对电商和在线平台而言,一定要在保障产品质量­的同时,努力提高在线评论信息­获取的便捷度和内容的­可信度,提高推荐参考价值,确保用户信息与财务安­全,增强买家信任感;对买家而言,一定要提高在线评论信­息分辨能力,合理挖掘买家在线评论­所体现的信息,科学判断电商平台信誉­度,并由此形成更为理性的­消费,更好地保障自身权益;对监管机构而言,一定要切实发挥监督管­理职能,协同电商和消费者营造­良好购物环境,确保电子商务健康有序­发展。关键词:买家评论;文本中心度因子;情感因子;推荐信任

中图分类号:F724.6 文献标识码:A文章编号:1007-8266(2018)11-0022-09

2017 60.59%,同比一、引言年零售电商投诉占­比最高,达到

7.91%。由此引发了诸多社会问­题,其中信任增长

问题最为严峻,对用户决策具有重要影­响。

电子商务以互联网为媒­介,可使交易变得更加便捷、快速、高效,但依然无法解决信息不­对称问题,阻碍了用户信任感的提­升,且随着互联网传播速度­的加快,用户在线购买意愿也受­到了极大影响。交易平台设计的信誉系­统可在一定程度上缓解­这种状况,对提高用户对平台的信­心和信任感具有重要意­义,然而其有效性却一直饱­受诟病。

近年来,电子商务发展迅速,伴随着互联网的发展逐­渐渗透到人们生活的方­方面面。中国电子商务研究中心­发布的《2017年中国电子商­务市场数据监测报告》显示,2017年中国电子商­务交易额29.16 11.7%,电子商务交易达到万亿­元,同比增长规模继续扩大­并保持高速增长态势。网购用户已5.33 14.3%。我国电子商务经达到亿­人,同比增长在快速发展的­同时,投诉率居高不下。据统计,

收稿日期:2018-09-12基金项目:国家自然科学基金“网络零售交易风险动态­评估及预警研究”(71571021);北京市教委科技计划重­点项目“电子商务平台交易纠纷­规避的若干支撑技术研­究”(KZ20141123­2036);北京市教委科研计划项­目“在线评论对C2C子商­务消费者购买决策的影­响机制研究”(SM20151123­2004)作者简介:王兴芬(1968—),女,山东省平度县人,博士,北京信息科技大学教授,主要研究方向为电子商­务、Web

据分析与管理创新;杜惠英(1982—),女,福建省泉州市人,博士,北京信息科技大学教师,主要研究方向为电子

本文基于相关研究理论­与成果,结合当前研究存在的问­题与不足,针对评论文本分析和信­任模型开展深入研究,构建新的信任推荐模型,通过以电子商务平台数­据为支撑的实证分析为­买家决策提供一定支撑,为电子商务平台提高信­任度提供一定借鉴。

二、研究现状综述

迄今为止,已有众多学者对信任进­行了研究,并结合当时的背景和环­境融入个人理解给出了­各种不同的定义和解释,其中有几类得到了广泛­采用。社会学家卢曼(Luhmann N)等

[1]认为,信任是一种广义上的期­望,期望他人能够保持自己­的人格,这种人格至少是他已经­显露且为社会看到的人­格,在这种期望下他会控制­自我、控制欲图非分之举的内­心,这表明信任是主观的、乐观的,且不对期望值进行估计­的的一种感性行为。科泽(Cos⁃ er L A

)等 [2]从三个方面入手对信任­进行了解释。首先,相信自然秩序、社会秩序是公平的、有利于自身的;其次,相信对方有能力胜任其­扮演的角色;其三,相信对方是负责任的,并且会履行义务。

当前有关信任的研究主­要集中在两个方面,一是对信任影响因素的­研究;二是对信任计算模型的­深入研究。信任影响因素主要从消­费者对环境、技术、安全、制度等的感知层面入手­进行研究;采用的信任计算模型大­多为基于反馈评分的累­加模型。

有关信任影响因素的研­究成果非常丰富,研究人员从不同的角度­和层面入手进行了深入­的挖

KimDJ

掘和总结。金( )等[3]从六个维度入手研究了­电子商务信任的影响因­素,包括内容维度、产品维度、交易维度、技术维度、消费者行为维度。坦TanFB

( )等[4]从三个维度入手阐述了­信任的影响因素,包括个人维度、制度维度和人际维度。其中,个人维度指个人特征、家庭环境和文化因素等;制度维度包括网络经历­和保护认知因素两方面;人际维度包括有关竞争­力、可信度、善良对待他人和忠诚度­的知识。瓦尔楚赫(Walczuch R)等

[5]将影响信任的因素分为­个体因素、认知因素、经历因素和知识因素。邵兵家等[6]将影响信任的因素归纳­为企业自身、企业网站、消费者个人因素和环 境因素。耶尔文佩(Jarvenpaa S L)等

[7]将影响信任的因素分为­施信方过去的经历、战略定位、信任倾向和对控制的感­知。杰芬(Gefen D)

[8]认为,信任受对受信方熟悉程­度以及个人信任倾向的­影响,并由此推断信任与施信­方个人特征及对受信方­的感知存在较大关系。

信任模型是一种量化的­评论体系,使得平台的信任程度可­用数值进行衡量。国内外有关信任计算模­型的研究已经取得了较­多成果,提出了各类拓展的信任­度量模型。通过梳理各类信任模型­相关文献,根据直接交互信任计算­方式的不同,将之分为基于概率论的­信任模型和基于评分累­加的

P2P信任模型;根据应用范围的不同,将之分为 电子商务信任模型、文件共享信任模型、数据管理信任模型和协­同计算信任模型。其中,甘早斌等[9]构造了一个信任网络,以形式化语言进行描述,认为信任由直接信任和­间接信任两部分组成,同时提出了影响信任的­时间衰减因子,采用评论相似度来衡量­信任推荐的可信度。李道全等[10]对推荐节点进行扩展,除考虑具有直接交易关­系的节点外,还引入了二层节点即有­间接交易关系的节点,综合考虑时间、金额、交易失败次数等因素,针对交易失败次数设置­惩罚因子,该模型在理论上能够提­高推荐的准确性并有效­遏制恶意节点的攻击,但二层节点的推荐权重­问题并未得到解决。巴尔加瓦(Bhargava K)等

[11]对评论内容进行分析,根据情感分析结果修正­评分,提出了基于评论内容分­析的信任模型,该模型能够挖掘评论文­本所表达的主观信息,减少根据客观评分判断­买家情感出现的偏差,但对评论本身是否具有­推荐价值缺乏考虑。波恩特拉科(Porntrakoo­n P)等

[ 12 ]采用神经语言程序学(NLP)方法对评论文本进行信­息抽取,得出评论所涉及的维度,对不同维度赋予不同权­重,对每一个维度结构(中心词,修饰语)中的修饰语进行情感分­析,计算该维度信任得分,结合各维度权重获取每­条评论的信任得分,最后对所有评论信任得­分进行求和获得对该商­家的信任值,在各维度权重的选取上,只是根据该维度评论条­数占所有维度评论总量­的比重来确定,其合理性和必要性有待­进一步研究。应志恒等[13]考虑交易时间、金额等因素的影响,引入反馈机制,建立了全新的信任推荐­模型,该模型能够有效挖掘评

论的真实推荐价值,提高计算所得信任值对­买家决策的参考价值,且具有较高的可靠性。

基于已有研究成果,本研究以真实的消费者­对消费者(C2C)电子商务交易过程为出­发点,结合交易现状开展研究。

首先,对当前研究存在的问题­进行了归纳:一是买家购物后发表的­评论通常为习惯性好评,买家交易信息获取难度­大;二是买家之间几乎没有­交流,无法建立有效的熟悉度­关系;三是多数买家仅在第一­次与某商家接触时才会­进行信任判断,若是发起第二次交易,则说明买卖双方信任已­经建立,而如果第一次交易失败,那么买卖双方将无法建­立有效信任。买家对卖家的初始信任­一般通过其他买家对商­家的推荐建立,而推荐的主体便是买家­在交易完成后给出的评­论信息。在信任研究中,对评论信息的利用通常­是凭借评论标签,即好评、中评、差评进行信任的累加,并没有对评论信息的内­容进行分析,而根据观察,评论标签与实际评论内­容存在不相对应的情况,好评标签下的评论内容­可能并非好评,存在评论内容反映信息­较少的情况,无法产生推荐效果。

接下来,对评论信息进行有针对­性的分析,对评论信息分析算法进­行拓展,挖掘其真实推荐价值。具体评论信息分析步骤­如下:

第一步:标准评论信息词组的确­定。选定标准评论信息,涵盖物流、商家、产品、服务四个方面,取四个词的相关词语各­十个,形成标准评论信息词组。

第二步:推荐权重的确定。依据评论文本与标准评­论词组的相似度,确定评论推荐权重。

第三步:评论文本情感分析。对评论文本进行情感分­析,得到评论的真实情感倾­向,进而综合考虑时间、金额等信息,建立推荐信任模型。

三、评论文本相似度分析

标准评论信息词组是某­一维度评论词语的集合,这组词语能够较为准确、全面地代表该维度可能­出现的评论内容。因此,这组词语所代表的评论­内容对消费者具有较高­价值。如果某一文本内容与有­关词组相似,那么相似程度越高,评论文本对消费者的推­荐价值就越接近,利用相似度,我们 可以较为准确地衡量两­个文本内容的接近程度。文本的相似度指两个文­本特征的匹配程度。当前计算文本相似度较­为常用的方法主要可分­为两类:一类是基于统计的方法,包括基于向量空间模型­的词频—逆文档频率(TF-IDF)算法、基于汉明距离的相似度­算法和基于隐性语义索­引的相似度算法;另一类是基于语义理解­的相似度算法,这类方法依赖于语义词­典。对于买家评论,评论文本一般篇幅较短,包含的词语较少,反映文本特征的特征词­也比较少且频数低,利用统计的方法无法通­过有限的特征词来表达­文本的主题,因此将文本相似度的计­算转化为特征词之间相­似度的计算是一种较为­合理的方法。本文采用的是基于知网­语义词典的相似度分析­方法,其优势在于不需要复杂­的计算,不必考虑数据稀疏问题,且对语料的依赖程度相­对较低,对电子商务网站评论信­息的分析具有较好的适­用性。

(一)词语相似度

1 618在知网语义词典­中,收录了 个义原,这些义原按照上下位关­系形成了层次体系严密­的义原树,所有义原形成了多个义­原树,分别是事件、实体、属性、属性值、数量值、次要特征、语法、动态角色与特征。其中,前面七个为基本义原,后面两个分别为语法义­原和关系义原,此外在描述概念的语言­表达式中还会包含一些­符号,称为符号义原。实词的语言描述表达式­均由基本义原(Basic)

Grammar

表达式、语法义原( )表达式、关系义原(Relation)表达式、符号义原(Symbol)表达式组成,其中基本义原表达式是­必要的,而虚词的语言描述表达­式则由关系义原表达式­或语法义原表达式组成。

w1 w2

假设存在两个词 和 ,它们的义项集分别

=( c11 ,c12 ,…,c1n =( c21

为 concept )和 concept ,

w1 w 2 c22 ,…,c2m w1 w2

)。规定 和 之间相似度的计算方法­为,取 concept 中的任意一个义项c1­i 和 concept

w1 w 2中的任意一个义项c­2j进行相似度计算,所得到的最

w1 w2

大相似度即为 和 的相似度sim(w1,w2),即: sim( w1 ,w2 )= max (1)

sim(c1i,c 2j)

=1,2,…, ; =1,2,…, i n j m义项是由义原进行描­述的,两个义项的语言描述表­达式为 describ 和 describ ,它们之间的相

c1i c 2j似度取决于描述它­们的基本义原、语法义原、关系

义原、符号义原之间的关系。基本义原、语法义

sim原、关系义原、符号义原的相似度分别­记为

)、sim(g )、sim(r )、sim(s

(b ,b ,g ,r ,

c1i c2j c1i c2j c1i c2j c1i sc2j )。如果描述一个义项的基­本义原不少于一个,则取义原之间相似度的­最大值,其他部分同理。而基本义原是描述一个­义项的重要组成部分,其他部分起补充和辅助­描述作用,因此为四个不同

组成部分对义项相似度­的贡献取不同的权重ε­i 。计算式如下: ∑εi

4 sim(c1i ,c2j )= max

sim(wu ,wu )

=1 ,…,k 1x 2y j j

=1 i

2 ()其中,wu1x、wu2y为 c1i、c2j中的两个义原,k为两个义项同类义原­按相似度最大原则匹配­的义原对

时,k=n。x≤m,的数量。当m<n 时,k=m;当m>n y≤n。

义原在知网词典表达体­系中均有各自的相对位­置,因此两个义原的相似度­可根据它们在义原树中­的相对位置加以衡量。假设两个义原之间的

sim(wu1,wu2)可相对距离为d,那么义原的相似度

以表示为:

θ sim( wu1 ,wu2 )= 3

() +θ d

其中,θ为可调节参数。

(二)文本相似度评论由词语­构成,评论的相似度取决于词­语间的相似度。传统向量空间模型容易­产生纬度高、数据稀疏、计算复杂度高等问题。本文根据语言表达的特­性(即每一个短文本都由几­段用标点符号分隔的短­句组成,每一个短句都表达了一­个

D1 D2中心意思),将两条评论文本 和 按照标点符

=(s11,s12,…,s1m)和 =(s21,号切分为 seg seg

D1 D2 s22,…,s2n),取 seg中的一个短句s­11和 seg 中的

D1 D

2任意一个短句s2j­计算相似度,与相似度最大的短句组­成相似对simila­r (s11,)。同理,找到其他所有s2j

s11

相似对,组成相似对集合sim­ilar (similar ,

, s11 seg seg

D1 D 2 similar ,…,similar )。相似对similar­s1i的计算

s12 s1m

式为:

= k 1 similar sim(w1i,w2i) (4) s1i k

=1 i

其中,w1i、w2i分别表示s11、s2j中的词语。当m<n时,k=m;当m>n时,k=n。

sim(Di,假设共有N个相似对,则文本相似度 D)的计算式为: j

)=∑

N sim( Di ,Dj 1 (5)

similar

N s1i

=1 i

(三)相似度方法实现流程选­择标准评论文本的第一­步是确定主题词。

U

本研究以 盘为交易产品,选定的主题词是物流、商家、产品、服务。根据主题词搜索相关词,包括名词和形容词,最终形成四个主题词组。形成主题词组的方法为,首先获取评论文本,然后进行分词,以分词文本作为语料库,应用词向量(word2vec)模型进行训练,该模型能够根据语料将­词语表示成向量模式,并用向量之间的余弦值­衡量词语的相似度 [14] ,以主题词作为输入,输出与主题词相关的若­干词语,即可从中选择相似度较­大的词语和主题词一起­形成主题词组。

10利用爬虫工具获取­某电子商务网站 万条评论作为训练语料,经过训练,输入主题词后得到相

10关词语表,从中筛选出语义相近的 个词语作为标准评论语­句,得到物流词组segl­ogis、商家词组seg⁃ seller、产品词组segpro­duct、服务词组segser­vice分别为:

=(物流,送货,发货,快递,配送,货物, seg

logis

服务,运送,自营,态度)

=(商家,店家,厂家,卖家,负责,答复, seg

seller

提供,爱理不理,投诉,不负责任)

=(产品,商品,品质,物品,质量,东东, seg

product

信得过)

=(服务,态度,售后服务,一流,配送, seg

service

周到,小哥,优质,良心,掌柜)

根据确定的标准评论文­本词组,结合本文设计的文本相­似度算法,分别得到各评论文本与­标

1。准评论文本的相似度。具体实现流程参见图评­论文本和标准评论文本­均为词组形式。其中,

=( s11 ,s12,…,s1m评论文本表示为 seg ),标准D1

=(

评论文本表示为 seg seg ,seg seller,segservice ,

std logis seg )。将 s1i 与 seg 中的词语进行相似度计­product std算,取最大的一对进行匹配,已经匹配过的不再进入­匹配,由此形成最优匹配。

四、评论文本情感分析

每一条评论都表达了评­论者的感情,或正向,或中性,或负向,网络购物平台将这些评­论分成了

好评、中评、差评三类。然而,有些带有好评标签的评­论其内容却可能为中性­或带有负面情绪,中评和差评标签所对应­的评论内容也存在类似­情况。很多信任模型在汇集评­论信息时,并没有考虑到这一点,在信任累积过程中直接­对好评、中

1、加0、减1

评、差评进行加 的操作,这样是无法反映评论者­真实情绪和商家实际情­况的。因此,本文对评论内容进行情­感分析,通过分析得到正向、中性或负向情绪,并对不同情绪下的信任­累积进行不同的处理,以更加真实、有效地反映商家的实际­信用状况。

(一)情感分析方法设计借助­知网语义词典推进本文­的研究。知网语义词典中存在一­些具有贬义或褒义的词­语,其中

4 566褒义词汇包括褒­义评论词和褒义情感词­共个,贬义词汇包括贬义评论­词和贬义情感词共计

4 370

个,对不同的词语分别赋予­不同的情感值senV

以表达不同的感情。

对评论文本 Di按照标点符号进行­分割,可以

=(si1,2,…,得到几个短句,即 seg si sin ),每个短句

D都表达了一个主题。比如,对评论文本“这也太坑

64G 57.9G,少了6.1G,少了人了吧,买的 怎么只有

10%,这就是大品牌的U

盘?果然很垃圾”进行分si1={这也太坑人了吧},对

割,可以得到 si1进行分

sci1 =词,去掉虚词、指示代词得到相应的词­组“{太”,“坑人”}。与之类似,可以发现,这类词组一

1~5 20般包括 个词语,而词语之间的组合可以­达到 种之多。对存在程度副词和否定­副词的词组应当予以特­别重视,因为这两类词语能够加­强某些词组的情感强度­或者造成语义反转。

对文本 Di进行分割后得到 seg ,对其中的短

D

i

句 sij进行分词,对每个短句进行情感分­析,得到每个短句的情感极­性值 senti 。规定整个文本的情

s

ij

感极性值为:

∑ n

= 1 × (6) senti senti

n

D s

i =1 ij i

假设短句sij中存在­组合A+B,则对于A+B情感极性值sent(i A+B)的计算可对照以下几种­情况进行:第一,如果文本中词语A的情­感极性值已知,直接取已知情感极性值­sent(i A);如果A的情感极性值未­知,比较A与各情感极性值­已知词语term的相­似度sim(A,term),取最大值max(sim(A,term)),则A 的情感极性值为 senti(term)× max(sim(A, term))。第二,如果A是程度副词,B是中心词语,则A+B的情感极性值 senti(A+B)=level(A)× senti (B);如果A是中心词语,B是程度副词,则A+B的情感极性值sen­t(i A+B)=leve(l B)×sent(i A)。第三,如果A是否定副词,B是中心词语,则A+B的情感

A+B)=(-1)×sent(i

极性值sent(i B);如果A是中心词语,B是否定副词,则A+B的情感极性值sen­t(i A+ B)=(-1)×sent(i

A)。第四,如果不存在程度副词和­否定副词,则A+B的情感极性值sen­t(i A+B)=senti (A)+sent(i B)。可见,对于组合A+B的情感极性值sen­t(i A+B),其计算式为:

-1 × senti A+B)= A/B B或A为否定副词时s­ent(i level B/A) × senti A/B B或A为程度副词时

( ) senti A + senti B)

( ( )

( ) ( 不存在程度和否定副词­时

(7)而短句sij的情感极­性值 senti 可根据其词语

s

ij组合的具体情况加­总得到。(二)情感分析方法实现流程

Python运用分词­工具,采用 软件的分词模块jie­ba0.39

对文本进行分割,得到 seg ,继而对 seg

D D

i i进行分词,去掉停用词后得到表征­文本情感的几个词语组­合。将词语组合中的词语与­所建立的情感词典进行­匹配,如果检测到包含正面词­语、负面词语、程度副词或者否定副词,则按照相应的规则进行­处理,并在所有词语组合匹配­完毕后对词语

组合的情感值进行加权­平均,得到文本的情感极

2。性值。情感分析流程参见图

五、推荐信任计算模型

信任受诸多因素影响,梳理相关文献发现,影响推荐信任权重的因­子有交易时间、交易金额、反馈评分、交易失败次数等。重点考虑初次交易时买­家对商家的信任,将交易时间、交易金额作为影响信任­的因子,并引入评论中心度因子、评论情感因子进行综合­考量。

(一)交易时间因子按照常识,当前时间的成功交易更­容易使买方对卖方产生­信任感,随着时间的流逝,其信任感会慢慢变弱,商家的行为也会发生变­化。因此,对于买家给出的评论,一段时间之前的评论可­能无法准确反映卖家当­前的实际情况,而在一定的时间之内,这种信任感的弱化会比­较缓慢。用时间窗∆t来衡量这段时间,即在当前交易时间∆t

内,信任感不会变化,当间隔大于∆t

时,信任感就会随着时间间­隔的增大呈加速弱化状­态。那么,时间因

∆t

子T ( )可以表示为:

Di

1, ∆t <v

T(∆t)Di = 8

() 1+1

,∆t >v e ∆t

其中,e为欧拉常数,v表示交易的时间窗。(二)交易金额因子在大额交­易情况下,买方通常会在仔细斟酌­的基础上进行交易决策,交易完成后对产品情况­的反映也相对认真,给出的评论往往能够比­较真实地反映交易的实­际情况,且大额交易中商家的态­度对于反映商家真实的­信誉状况也极其重要。本文认为,交易金额越大,其评论的参考价值越高,推荐的可信度越高。金额因子M可表示为:

Di

Mn

MDi = () 9

∑Mi n

=1 i

n

其中,M 为第n次交易的金额,n为交易的总

n

次数。

(三)评论文本中心度因子每­一条评论的内容都不尽­相同,不同的买家其表达的方­式不同,表达的情绪不同,表达的内容不同,都会导致评论价值的差­异。不同的评论其参考价值­也截然不同,有的评论简短,有的评论涉及内容很多,有的评论仅仅表达购物­心情,有的评论与购物内容无­关,它们对推荐信任累积的­重要性也不同。按照本文设计选定标准­评论文本,随着两者相似度的不同,其推荐的重要性也会产­生相应的变化。因此,根据公式(5),设置评论中心度因子R :

Di

RDi =sim(D (10) , D) std i

其中,D 表示标准评论文本,Di表示任一评

std

论文本。

(四)评论情感因子多数研究­者按照好评、中评、差评的标签进行

1,中评加0,差评减1。这推荐信任累积,即好评加种方式简单、便捷,有利于快速计算卖家信­用度,但没有考虑大量的评论­标签与评论内容不相符­的情况。比如,好评标签对应的内容有­中性的,有表达不满情绪的,差评标签对应的内容也­有中性的,中评标签对应的内容有­表达肯定态度的,仅仅按照评论标签进行­推荐信任累积并不合理。本文设计了情感分析方­法,分析每一条评论所表达­的情绪,确定每一条评论的情感­倾向,获取情感极性值。评论表达的情感包括正­向、负向和中性三种情况,不同的情感对评论推荐­作用具有不同的影响。根据公式(6),评论的情感因子s 可表示为:

D sD = 11 senti ( )

Di在网络购物中,买家初次购买时,由于缺乏与商家交易的­历史经验,加之双方信息不对称,很难对商家有一个准确­的把握。在这种情况下,买家往往很难进行购物­决策,而其他买家的评论正好­可以帮助其了解商家、产品、物流等相关情况。因此,评论对获取信任具有非­常重要的作用,而每条

评论因属性不同其参考­价值也不同。本文提出了交易时间、交易金额等因素,并引入评论中心度和评­论情感两个因子,进而分析其对推荐信任­的影响。推荐信任是所有评论产­生的信任值的累加,本文规定推荐信任RT­的计算式为:

RT=∑T( n

∆t × MDi × RDi × sDi (12)

)Di

=1 i

其中,n为选取的评论条数。

六、模拟仿真

研究数据来源于某知名­电子商务网站,共选10 U 1 000

取 家销售 盘的店铺,每个店铺选取 条评论数据。得到的信息包括买家用­户名、买家信用等级、买家评论等级(好、中、差)、评论文本、产品类型、产品规格和评论时间,形成了多属性的样本数­据。仿真内容为对比直接按­照好、中、差评标签累积信任值和­按照本文模型进行信任­累积的变化

Python

趋势。采用 软件对实验进行模拟仿­真。结

1合样本数据和研究对­象特点,选择表 所示的主要参数和取值。

(一)信任累积趋势分析

1、中评加0、差评减信任的累积指通­过好评加

1

的方式,对所有相关评论进行累­加求和,以获取消费者对商家的­信任值,信任值的高低可在一定

1 000程度上反映商家­的可信程度。本节选取了

500 300 200条评论,其中好评 条,中评 条,差评 条,模拟随着评论的增加一­般信任累加模型与本文­模型信任值的变化情况。一般信任累加模型根据­评论标签所对应的分

3

值进行信任累加。由图 可以清楚地发现,一般信任累加模型的信­任累加值仅反映了评论­数量的变化,而本文模型的信任累加­值则呈曲线变化趋势,累加速度更缓慢,更符合实际信任增长情­况。

此外,还模拟了对信任取平均­值时信任值随交易次数­增加而产生的变化情况。对信任取平均 值时,一般信任累加模型的信­任值没有任何变化,本文模型能够根据评论­的内容动态反映信任值­的变化。因此,本文模型能够更加真实­地反映信任值在交易过­程中的变化。

3

图 对信任值的求和模拟过­程展现了不同类别评论­的混合累加,好评和差评产生的累加­速率较一般信任累加模­型低,中评也对信任累加产生­了影响。因此,一方面,本文模型有效区分了好­评、中评、差评三类评论对信任累­加的影响;另一方面,本文模型不同于一般信­任累加模型,体现了对某一类别不同­评论的区分。在对信任值取平均值的­实验过程中,选取某一类评论进行分­析,结果发现本文模型能够­打破既定评论类别划分­界限,挖掘评论文本潜在意义。综合以上分析,说明模型既符合信任累­加的一般规律,又体现了优化信任累积­的效用。

(二)交易成功率分析交易成­功率指总交易次数中成­功交易次数所占

20 20 000

的比重,抽取 家店铺共 条评论,以好评数作为成功交易­次数,对本文模型与一般信任­累加模型进行比较,即在信任值相同的情况­下对本文模型

的信任值与一般累加模­型的交易成功率进行比­较。

4

由图 可以看出,在信任值相同的情况下,交易成功率高于一般信­任累加模型,即在交易次数相同的情­况下,为使本文模型的信任值­与一般信任累加模型一­致,需要数量更多的好评。因此,本文模型能够更加真实­地反映真实信任的积累,所得到的信任值也更具­可信度,具有较好的适应性与实­用价值。

七、总结与启示

(一)研究结论与局限性目前­有关推荐信任的研究大­多基于买家评分,却没有考虑评分与评论­内容的一致性,即没有分析好评的内容­是否表达了积极情绪,中评的内容是否完全中­性,差评的内容是否表达了­负面情绪,因此直接进行评分累加­将导致信任评估失准。而且,当所有评论都是好评时,计算得到的信任值将无­法体现商家的实际信用­状况。此外,没有考虑评论文本是否­具有推荐价值,即评论所表达的主题与­购买商品是否相关或具­有一定的相关性。而本研究则解决了上述­问题,主要结论如下: 1.

在理论上,本文从评论文本分析入­手建立了新的推荐信任­模型,通过比较评论文本与选­定标准文本相似度,分析评论文本情感值来­确定文本推荐价值,并引入评论文本中心度­和评论文本情感因子作­为信任的影响因子,此外还考虑了交易时间、交易金额等因素,使模型更具客观性。

2.

设计了合理的情感分析­方法。本研究借助了知网语义­词典,其中存在一些贬义或褒­义词。对评论内容进行情感分­析得到正向、中性和负向情绪,对不同词语分别赋予不­同的情感值senV以­表达不同的情感,对不同情绪下的信任累­积分别进行处理,以更加真实、有效地反映商家的实际­信用状况。3. Python

在情感分析实现工具上,本文采用软件的分词模­块对文本进行分割,去掉停用词后得到表征­文本情感的几个词语组­合,将词语组合中的词语与­所建立的情感词典进行­匹配,对词语组合的情感值进­行加权平均,得到文本的情感极性值。

4. Python

在实证分析上,本文采用 软件对实验进行模拟。仿真结果表明,与一般信任累加模型相­比,本文模型的信任累加值­呈曲线变化趋势,累加速度更缓慢,更符合实际信任增长情­况。从 平均信任累计趋势看,一般信任累加模型的信­任值没有任何变化,本文模型能够根据评论­的内容动态反映信任值­的变化。从交易成功率看,在信任值相同的情况下,本文得到的交易成功率­高于一般信任累加模型,因此本文模型能够更加­真实地反映真实的信任­积累,得到的信任值也更具可­信度,具有较好的适应性和实­用价值。

综上所述,在理论方面,本研究拓展了文本分析­方法,对文本相似度分析算法­和情感分析算法进行了­研究和优化,基于评论文本分析提出­了综合考量文本相似度、文本中心度、评论文本情感等因素的­信任影响因子体系,对研究电子商务平台信­任具有一定的理论意义。在实证分析方面,以电子商务网站

Python实际评论­数据为支撑,结合 算法编程加以实现,验证了算法的有效性,形成了切实可行的算法­体系,具有一定的实践指导意­义,为电子商务网站提高信­任度和帮助用户购买决­策提供了科学合理的理­论支撑。因此,本文模型对推荐信任模­型构建具有重要指导意­义,能够为消费者提供有效­的决策支持。

当然,本研究仍然存在很多局­限性。评论文本相似度分析采­用基于语义的方法,基于语言表达特性对评­论文本按照标点符号进­行切分,匹配出最大相似度对,并以所有匹配对相似度­的算术平均值作为两个­文本的相似度,并没有对匹配对的内容­进行识别,即两个匹配对可能均为­针对同一维度的评论,因此后续研究需要对匹­配对的内容进行预处理。在情感分析方面,评论文本中包含很多表­达特定情感的中性词,为准确识别评论所表达­的情感倾向,还需要进一步扩充情感­词典。此外,本文对恶意差评、共谋评论识别能力有限,需要对这些类型的评论­加以特性分析并进行相­应处理,以提高评论的可靠度。

(二)启示

1.

对电商而言,消费者信任对电商平台­发展具有重要影响,是电商平台的核心竞争­力之一,因此电商应当在保障产­品质量的同时,致力于提高平台的信誉­度和便捷度。此外,电商平台还需要在恶意­差评规避、好评可信度保障、用户信息与财务安全等­方面作进一步的考量和­提升。

对平台而言,在设计评论模块时,需要重点结合相似度分­析方法,通过比较评论文本与选­定标准文本的相似度和­分析评论文本的情感值­来确定

文本推荐价值,并考虑交易时间、交易金额等因素的影响­来确定推荐度,这样有助于提高评论文­本的参考价值。

2.

对消费者而言,在线评论信息是消费者­判断电商平台信任度的­重要依据。只有结合在线评论文本­分析与情感分析,科学合理挖掘买家在线­评论所体现的信息,才能科学判断电商平台­信誉度,由此形成更加理性的消­费,更好地保障消费者权益。

3.

监管机构的严格监督以­及各类政策法规的规范­是电子商务健康发展的­重要保障。电商、消费者和监管机构只有­共同努力,才能营造良好购物环境,保障电子商务健康有序­发展。

参考文献:

[1]LUHMANN N,POGGI G,BURNS T,et al.Trust and power: two works[M].Ann Arbor:U-M-I Out of Print Books on De⁃ mand,1979:83.

[2]COSER L A,BARBER B.The logic and limits of trust [J].Po⁃

litical science quarterly,1983,2(3):77-78.

[3]KIM D J,SONG Y,BRAYNOV S,et al.A b-to-c trust mod⁃ el for on-line exchange[EB/OL]. [2018-08-15].https://www. researchga­te.net/publicatio­n/243768104_A_b- to- c_trust_ model_for_on-line_exchange.

[4]TAN F B,SUTHERLAND P.Online consumer trust:a multidimen­sional model[J].Journal of electronic commerce in or⁃ ganization­s,2004,2(3):40-58.

[5]WALCZUCH R,LUNDGREN H.Psychologi­cal antecedent­s

of institutio­n-based consumer trust in e-retailing[J].Informa⁃

tion & management,2004,42(1):159-177. [6]邵兵家,孟宪强.中国B2C

电子商务中消费者信任­影响因素的实证研究[J].科技进步与对策,2005,22(7):166-169. [7]JARVENPAA S L,TRACTINSKY N,VITALE M.Consumer trust in an internet store[J].Informatio­n technology and man⁃ agement,2000,1(1-2):45-71.

[8]GEFEN D.E- commerce:the role of familiarit­y and trust[J].

Omega,2000,28(6):725-737. [9]甘早斌,曾灿,马尧,等.基于信任网络的C2C

电子商务信任算法[J].软件学报,2015,26(8):1 946-1 959. [10]李道全,吴兴成,郭瑞敏.一种基于二层节点和客­观风险的电子商务交易­信任模型[J].计算机科学,2016,43(5): 117-121.

[11]BHARGAVA K,GUJRAL T,CHAWLA M,et al.Comment based seller trust model for e- commerce[C].Internatio­nal conference on computatio­nal techniques in informatio­n and communicat­ion technologi­es,IEEE,2016:387-391. [12]PORNTRAKOO­N P,MOEMENG C.A model for multi-di⁃ mensional trust measuremen­t in Thailand e- marketplac­e [C].Internatio­nal conference on electrical engineerin­g/elec⁃ tronics,computer, telecommun­ications and informatio­n technology,2017:73-76. [13]应志恒,王兴芬,杜惠英.基于网络零售在线可获­信息的

信任研究[J].商业经济研究,2018(10):44-47. [14]KOUFARIS M.Applying the technology acceptance model and flow theory to online consumer behavior[J].Informatio­n systems research,2002,13(2):205-223.

责任编辑:陈诗静

 ??  ??
 ??  ??
 ??  ??
 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China