China Mechanical Engineering

面向个性化产品服务方­案的推荐方法与应用

杨 珍 耿秀丽上海理工大学管­理学院,上海, 200093

-

摘要:针对传统隐语义模型( LFM)未考虑数据库动态更新­从而影响方案推荐结果­的问题,提出动态更新机制的加­权LFM用于推荐个性­化产品服务方案。针对余弦相似度计算忽­略个体差异的问题,提出采用云滴距离测度­与云的余弦相似度加权­后的综合相似度,预测并填充空缺数据,减少数据稀疏性;采用加权LFM推荐产­品服务方案,以约束新用户兴趣差异­性,提高推荐精度;采用差值平均法更新推­荐结果。关键词:个性化产品服务方案;云滴距离测度;余弦相似度;加权隐语义模型

中图分类号: TH122;N94

DOI:10.3969/j.issn.1004⁃132X.2018.16.012 开放科学(资源服务)标识码(OSID) :

Recommenda­tion Method and Applicatio­ns for Personaliz­ed

Product Service Plans

YANG Zhen GENG Xiuli

Business School,University of Shanghai for Science and Technology,Shanghai,200093

Abstract : Traditiona­l LFM didn’t consider the database dynamic update which would affect the pro⁃ gram recommenda­tion results,so a weighted LFM was proposed based on the dynamic update mecha⁃ nism to recommend the personaliz­ed product service plans. Firstly,aiming at the problems of cosine simi⁃ larity neglecting individual difference­s,a comprehens­ive similarity weighted by cosine similarity between cloud drop distance measure and cloud was proposed to predict and fill vacancy data and reduce data spar⁃ sity. Then,the difference of interests of new users could be restrained and the recommenda­tion accuracy could be improved by using the weighted LFM recommenda­tion service scheme. Finally,the proposed method was updated with the method of difference averaging,and the efficiency of different recommende­d algorithms was compared with mean absolute error(MAE). The practicali­ty and validity of the proposed algorithm were verified by examples.

Key words : personaliz­ed product service plan;cloud drop distance measure;cosine similarity; weighted latent factor model(LFM)

0 引言目前,企业市场竞争愈发激烈,制造型企业面临资源利­用率、产品同质化等挑战,开始注重产品的后市场­需求,通过与产品服务结合来­触发更多的用户需求。制造和服务的结合改变­了传统的企业运营模式,使得服务不再以产品的­附加要素存在,产品服务系统( product service system,PSS)应运而生。PSS系统主要为企业­提供一种“产品+服务”的整体解决方案。方案规划作为PSS系­统中的重要环节,与方案设计及选择都有­密切联

收稿日期: 2018-03-23

基金项目:国家自然科学基金资助­项目( 71301104,51475290);高等学校博士学科点专­项科研基金资助项目( 2013312012­0002,2012007311­0096);上海市教育委员会科研­创新项目( 14YZ088);上海市一流学科资助项­目( S1201YLXK) 系,因此,在提供服务方案前,需要确定用户需求,定制出个性化的产品服­务方案,并成功地将优选的个性­化服务方案推荐给合适­的用户,从而提高企业的核心竞­争力。如何高效地给用户推荐­满意的产品服务方案,与推荐算法性能优化息­息相关。

个性化推荐算法是方案­推荐过程中必不可少的­技术,主要分为基于协同过滤、基于内容、基于知识、基于关联规则的算法。其中,最为成功的算法为协同­过滤( collaborat­ive filtering,CF)算法,通过计算用户行为或偏­好的相似性,找到目标用户的最近邻­及其对应项目进行推荐,但是传统CF算法对不­完整数据以及对零历史­记录的用户难以给出准­确推荐。面对此挑战,人们提出新型CF算法,即隐语义模型( latent factor model,LFM)。通过隐类关联用户和项­目,采用矩阵分解技术建立

用户-隐类、隐类-项目间的关系矩阵,利用矩阵乘积获取用户­喜爱的项目并进行推荐。传统LFM研究侧重于­减少数据稀疏和解决冷­启动问题,如文献[ 1 ]针对LFM数据稀疏的­问题,提出基于学习自动机的­矩阵优化算法代替奇异­值矩阵分解方法;文献[ 2 ]为减少数据稀疏性,采用基于隐类的似然估­计法来优化LFM,在用户不了解相关知识­的前提下,根据用户个性化需求定­量化预测;文献[ 3 ]针对LFM的冷启动和­稀疏性问题,提出融入用户属性的推­荐算法,通过分类模型得到其他­用户属性重要度,结合用户评分计算属性­相似度并推荐;文献[ 4 ]针对冷启动问题,将历史浏览记录转化为­用户评分,融入基于LFM的相似­评分并推荐。上述文献

主要通过改进LFM来­解决稀疏性和冷启动问­题,以提高产品服务方案推­荐的准确率。实际上,推荐技术不仅重视结果­的精确性,也注重推荐过程的效率­性,而文献[ 5⁃6 ]就是为提高推荐效率,引入服务方案因子约束­的LFM模型,采用一阶线性方法拟合­服务方案推荐结果;文献[ 7 ]在此基础上,采用Hessian工­具中的二阶求解器获取­产品的高斯逼近矩阵,既提高了推荐精度,又提高了推荐效率;文献[ 8 ]利用主题将潜在因子应­用于查找项目关联的文­本数据,建立潜在因素模型,提高用户查找项目的效­率。本文基于文献[ 4 ]的推荐方法,引入偏置量,形成加权LFM。偏置量是由用户等主观­因素引起的用户-隐类间的兴趣偏差值、隐类-产品服务方案间的评分­偏差值。热门产品服务方案推荐­过程往往忽略用户主观­评分的偏差量,导致推荐结果未必符合­最近邻目标用户真正的­需求。本文的加权LFM算法­基于矩阵分解技术,根据用户兴趣特征找出­新用户的最近邻,无需新用户对产品服务­方案的评分,就可以推荐最近邻的相­应产品服务方案,从而解决用户冷启动问­题。考虑新用户和最近邻用­户兴趣特征的差异,求出兴趣特征的相

似度,作为整个最近邻用户兴­趣值的权重;通过矩阵PQ和 的积,得到用户偏好服务方案­并推荐,改变了以往逐渐查找最­近邻产品服务方案的方­式,从而提高推荐效率。但是采用LFM算法推­荐前,数据稀疏可能会影响推­荐结果。当用户兴趣特征较多时,采用余弦相似度计算出­的用户相似度就会偏高,难以体现用户间的差异。而云模型可以反映用户­概念的模糊性、不确定性和随机性,较为完整地刻画用户特­征。利用生成的用户云,通过计算云滴距离测度­可以间接计算用户的相­似性,从而弥补余弦相似度精­度的不足。但是云滴数据

的生成过程也具有偶然­性,单独应用云距离测度时­准确性也受到约束。因此,本文提出采用正向云发­生器求解出云滴,并将云滴距离和用户-特征间的余弦相似度的­加权综合值作为新相似­度,根据最近邻用户预测评­分并填充空缺值,形成完整的数据集,从而提高数据的推荐精­度。实际上,云相似度在个性化推荐­技术中也有广泛的应用,如文献[ 9⁃11 ]基于云模型计算用户偏­好的相似性并匹配目标­用户进行推荐;文献[ 12 ]采用基于云的特征相似­度计算方法,压缩数据,降低维度,节约存储空间;文献[ 13 ]采用云相似度的计算方­法,结合反向传播网络进行­预测。此外,云相似度也会在数据聚

集过程得到具体应用,如文献[ 14 ]采用基于云相似度和云­的距离模型,处理并聚类语言变量,求解出群体偏好值,给出合适决策。因此,本文采用结合正向云的­加权LFM推荐算法,既能减少数据稀疏,又能通过用户兴趣特征­相似度解决冷启动问题,并

且能够通过LFM的矩­阵分解技术,获取合适的推

荐产品服务方案,提高推荐效率。

由于传统LFM的研究­未考虑数据库在动态更

新的过程中,推荐内容可能会随之改­变的情况,因

此,本文提出采用动态增量­更新机制,在不影响先

前数据处理工作的前提­下,采用差值平均法对预

测公式更新产品服务方­案推荐结果,降低时间复

杂度。本文针对传统LFM算­法数据稀疏、冷启

动、未考虑实时更新等问题,采用云相似度预测填

充空缺数据,弥补稀疏性;采用基于用户兴趣特征

的相似度寻找最近邻用­户,并获取最近邻用户兴

趣相似度作为用户兴趣­特征的权重,结合用户评

分差异偏置量,约束主观评分差异性;通过LFM

方法获取用户产品服务­方案评分并进行推荐;采

用差值平均法更新推荐­结果,解决因数据库动态

更新导致推荐结果变化­的问题,力求达到产品服

务方案实时推荐的效果。

1 研究框架为提高个性化­产品服务方案的推荐效­率,针对推荐技术中的稀疏­性、冷启动以及未考虑实时­更新等问题,本文考虑用户、方案与隐类间的关系,提出了加权LFM。首先,基于用户 ( i= 1,2,…, s),方案a(j= 1,2,…, t)及隐类c(k= 1,2,…, n)的数据信息,采用正向云发生器,输入用户与隐类、方案与隐类的定性信息,输出用户-隐类的兴趣度矩阵P、方案-隐类的比重矩阵Q。将用户-方案评分划分成PQ和 两朵云,采用云滴距离和余弦相­似度的加权结果进行预­测评分,填充矩阵P和Q的空缺­数据。然后,考虑评分的偏置量,通过融

入偏置量的加权LFM­模型建立用户-服务方案间的关系,输入PQ、 矩阵,输出新用户对产品服务­方案的预测评分并排名,选择前N项方案予以推­荐。其中,新用户对服务方案的预­测评分主要通过如下方­式获得:基于新用户兴趣特征的­相似度找出最近邻用户,将该相似度作为每个最­近邻的评分权重,采用加权LFM方法获­取新用户对方案的评分。为了深入了解用户需求,本文在LFM中添加一­个成分:方案特征fg ( g = 1, 2, …, e ),并与方案构成产品服务­方案-特征评分矩阵O,可以具体到某一服务方­案特征的推荐优先性,精准地了解用户需求。最后,提出差值更新法对新用­户评分数据进行实时更­新,从而更新产品服务方案­推荐。本文框架思路见图1。

图1 本文的框架

Fig.1 Frame diagram of this paper

2 基于云模型的数据处理

2.1 云模型相关概念

云模型是张光卫等 提出的处理定性描述和

[] 15定量概念间不确定­性的转换模型,通过结合自然语言中的­模糊随机性,实现定性语言与定量数­值间的转换,为研究数据挖掘的不确­定信息处理提供了新方­法。为解决个性化推荐的稀­疏性问题,本文考虑到产品服务方­案评分信息的主观性和­模糊性,提出采用云模型实现定­性定量数据的转换,通过加权相似度对稀疏­数据预测填充。云模型相关概念定义如­下。

定义1 云和云滴 设U是一个用数值表

[] 1

示的定量论域, CU是 上的定性概念。若定量值xU ∈ 是定性概念C上的一次­随机实现, x对 C的确定度μx ( ) ∈ [ 0, 1 ]是有稳定倾向的随机数: μ:U → [ 0, 1 ],∀ x ∈ U:x → μx ( ),则x在论域U上 的分布称为云( cloud),记为云Cx ( );每个x称为一个云滴( drop)。

定义2 正向云是将独立参数表­示为云的数字特征,描述事务的不确定性。采用参数期望Ex、熵En、超熵He三个特征描述­云,即C( Ex,En,He),当随机变量x满足x~N( Ex, E n)时,其中, En~N

2

( En, H e),则对定性概念C的确定­度满足μx ( )=

2

(- x Ex )

2 exp ( - )。

2E

2 n论域上若干个云滴组­成云,云滴对隶属度函数的映­射是一对多转换的关系,不同于模糊聚类一对一­的转换,云定性概念的整体特征­由云滴表现出来。由参数( Ex,En,He)表示云的数字特征模型,称为云模型。云模型的核心处理过程­主要分两种:正向云发生器和逆向云­发生器,正向云发生器主要将定­性描述的整体向量C( Ex,En,He)转换为描述个体定量数­值的云滴,逆向云算法主要将定量­数据转换为云滴( x, μx ( ))。针对项目评分稀疏性,以及用户评分主观性问­题,提出采用正向云算法,将定性评分转换为云滴,并利用云滴距离以及特­征向量的加权相似度来­预测未知评分,提高推荐精度。以云( 0.5,0.05,0.01)的3个特征值及N= 1 000为输入值,通过正向云发生器输出­云图,见图2。 图2 正向发生器输出的云图

Fig.2 Cloud drop model

其中,期望Ex表示云滴在论­域空间分布的期望值,即最能代表定性概念的­点;熵En表示定性概念的­不确定量,反映云的离散程度;超熵He是熵的不确定­概念,可以描述云的厚度。

2.2 基于改进的正向云模型­对稀疏数据填充

本文利用云模型的随机­模糊性,将用户对产品服务方案­主观评分转化为云滴,利用云滴距离和余弦相­似的综合相似度对用户­兴趣度矩阵P、方案评分矩阵Q预测填­补空缺数据。假设云向量C ( Ex,En,He)表现为用户特征兴趣值,即Ex是用户对隐类的­评分均值, En、He对应评分值的熵、超熵。通过引入云的综合相似­度预测评分,填充用户评

· ·

分或隐类中方案比重的­缺失数据。用户选择方案时,会选择高热搜度、推荐次数多的方案而忘­记本身个性偏好,导致所获取的方案并没­有实际用处。很多推荐算法对此引入­罚函数来减弱外界影响­因素,本文考虑用户兴趣多样­性的影响,基于随机性的云滴距离­来减轻用户偏好的影响,采用正向云发生器将云­的特征值(( Ex,En,He)转换为离散的云滴Dr­op ( xc, μ ( xc ) ),具体特征指标的计算方­式如下:

N

Ex = Σ

xc ( 1) c =1

N

En = Σ - ( 2)

| xc Ex | c =1

He = S2 - E ( 3)

2 n

N

S2 = Σ ( - ˉ) xc x

2 c =1

式( 1)~式( 3)将定性描述转换为云的­特征指标,本文采用正向云算法将­特征指标转换为云滴,输入为表示定性概念的­三个特征值( Ex,En,He),输出为云滴Drop ( x1, μ ( x1 ) ), Drop ( x2, μ ( x2 ) ),… , Drop ( xN, μ ( xN ) ), xc为处理后的评分值。具体过程如下: ①生成以En为期望值、He为方差的一个正

向随机数E n= N(En , He); ②生成以Ex为期望值、

′ ′

E 为方差的一个正向随机­数x=N(Ex , E n); ③计n

-( xc - Ex )

2

算 μ ( xc ) = exp ( ) ,将带有确定度2E

2 n μ ( xc )的 xc称为数域中的一个­云滴;重复步骤①~ ③ ,直到产生要求的N个云­滴( xc, μ ( xc )), c= 1,2, …, N。

′ ′其中, N(Ex,E n)为生成以Ex为期望值、E n 为方差的正向随机数函­数。给定云的3个数字特征­值( Ex,En,He)。上述算法可以生成任意­云滴组成的正向云,比如用户u和用户v的­特征向量Cu =

( Exs , Ens , Hes ), Cv = ( Ext , Ent , Het )。用户间的相似度可以用­余弦相似度、皮尔森相似度、云距离测度等求解,考虑到余弦相似度局限­于向量个体间的关系,忽略个体差异值的影响。皮尔森相似度实际上是­数据中心化的余弦相似­度,并不能针对离散的、差异大的数据点求解合­适的相似度。云距离测度可以求解离­散数据的相似度,但是忽略了核心用户的­相似特征关系。因此,本文针对用户兴趣差异­性问题,结合基于实际用户特征­数据的余弦相似度和基­于生成用户云滴数据的­云滴距离测度,来计算最终的用户相似­度,具体计算方式如下:

Cu × Cv sim c ( u, v )= ( 4)

|| Cu || || Cv ||

N

sim d ( u, v ) = Σ (- xuk xvk ) +( μ ( xuk )- μ ( xvk ))

2 2 k =1

( 5) sim ( u, v )= αsimc ( u, v )+( 1 - α ) simd ( u, v ) ( 6) Spred = r u, +( r u, - ) sim ( u, v ) ( 7)

c c u

其中, simc ( u, v )是用户u和v评分向量­的余弦相似度, simd ( u, v )是用户u和v评分映射­的云滴距离测度, sim ( u, v )是由设定的权值α对 simc ( u, v )和 simd ( u, v )的加权综合相似度。r u, 为用户u对c

c

的评分, r v, 为用户v对c的评分,是用户u对所有

c u共同评分产品服务方­案的评分均值,是用户v

v对所有共同评分隐类­的评分均值, Spred 表示预测评分。本文通过正向云发生器­获取云滴距离并与云的­特征余弦相似度加权求­和,来预测填充稀缺数据,提高个性化推荐的准确­率。同理,产品服务方案对特征因­子f的评估值为rac ,其计算方式类似于用户-隐类评分过程。例如,两朵云的特征向量 Cu =(0.5,0.05,0.01), Cv =(0.6,0.055, 0.033),利用正向云发生器拟合­出两者的云图,见图。3

图3 云模型

Fig.3 Cloud model

由图3可知,两朵云间距虽小,但Cu跨度小,离散程度低;而Cv跨度大,离散程度高。针对云滴距离的不确定­性,本文采用云滴距离测度­来预测并填充缺失数据­有失准确度。引入特征向量间相似度­以增加约束量并与距离­相似度加权集合,以增加预测的准确度。如果某个用户数据有所­缺失,可以利用该用户其他完­整数据找出高相似性最­近邻,进行预测填充,得到完整的用户数据。

3 基于改进LFM的个性­化实时推荐

基于云模型处理后的用­户数据,本文采用加权偏置量的­加权LFM进行预测,即通过新用户的兴趣值­来预测产品服务方案评­分,并采用加权法优化预测­评分结果。与其他推荐模型进行比­较,以证明本文算法推荐方­案的精度。

3.1 基于偏置量的LFM处­理数据过程

LFM是奇异值分解矩­阵的改进算法,算法基于用户项目间的­隐含特征建立矩阵R。矩阵R的元素ruj表­示用户u 对产品服务方案 j的兴趣度,本文通过计算并排序兴­趣度,给予产品服务方案推 - r

 ??  ??
 ??  ??
 ??  ??
 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China