面向个性化产品服务方案的推荐方法与应用

杨珍耿秀丽上海理工大学管理学院，上海， 200093

2018-08-25 -

摘要：针对传统隐语义模型（ LFM）未考虑数据库动态更新从而影响方案推荐结果的问题，提出动态更新机制的加权LFM用于推荐个性化产品服务方案。针对余弦相似度计算忽略个体差异的问题，提出采用云滴距离测度与云的余弦相似度加权后的综合相似度，预测并填充空缺数据，减少数据稀疏性；采用加权LFM推荐产品服务方案，以约束新用户兴趣差异性，提高推荐精度；采用差值平均法更新推荐结果。关键词：个性化产品服务方案；云滴距离测度；余弦相似度；加权隐语义模型

中图分类号： TH122；N94

DOI：10.3969/j.issn.1004⁃132X.2018.16.012 开放科学(资源服务)标识码(OSID) ：

Recommendation Method and Applications for Personalized

Product Service Plans

YANG Zhen GENG Xiuli

Business School，University of Shanghai for Science and Technology，Shanghai，200093

Abstract ： Traditional LFM didn’t consider the database dynamic update which would affect the pro⁃ gram recommendation results，so a weighted LFM was proposed based on the dynamic update mecha⁃ nism to recommend the personalized product service plans. Firstly，aiming at the problems of cosine simi⁃ larity neglecting individual differences，a comprehensive similarity weighted by cosine similarity between cloud drop distance measure and cloud was proposed to predict and fill vacancy data and reduce data spar⁃ sity. Then，the difference of interests of new users could be restrained and the recommendation accuracy could be improved by using the weighted LFM recommendation service scheme. Finally，the proposed method was updated with the method of difference averaging，and the efficiency of different recommended algorithms was compared with mean absolute error（MAE）. The practicality and validity of the proposed algorithm were verified by examples.

Key words ： personalized product service plan；cloud drop distance measure；cosine similarity； weighted latent factor model（LFM）

0 引言目前，企业市场竞争愈发激烈，制造型企业面临资源利用率、产品同质化等挑战，开始注重产品的后市场需求，通过与产品服务结合来触发更多的用户需求。制造和服务的结合改变了传统的企业运营模式，使得服务不再以产品的附加要素存在，产品服务系统（ product service system，PSS）应运而生。PSS系统主要为企业提供一种“产品+服务”的整体解决方案。方案规划作为PSS系统中的重要环节，与方案设计及选择都有密切联

收稿日期： 2018－03－23

基金项目：国家自然科学基金资助项目（ 71301104，51475290）；高等学校博士学科点专项科研基金资助项目（ 20133120120002，20120073110096）；上海市教育委员会科研创新项目（ 14YZ088）；上海市一流学科资助项目（ S1201YLXK）系，因此，在提供服务方案前，需要确定用户需求，定制出个性化的产品服务方案，并成功地将优选的个性化服务方案推荐给合适的用户，从而提高企业的核心竞争力。如何高效地给用户推荐满意的产品服务方案，与推荐算法性能优化息息相关。

个性化推荐算法是方案推荐过程中必不可少的技术，主要分为基于协同过滤、基于内容、基于知识、基于关联规则的算法。其中，最为成功的算法为协同过滤（ collaborative filtering，CF）算法，通过计算用户行为或偏好的相似性，找到目标用户的最近邻及其对应项目进行推荐，但是传统CF算法对不完整数据以及对零历史记录的用户难以给出准确推荐。面对此挑战，人们提出新型CF算法，即隐语义模型（ latent factor model，LFM）。通过隐类关联用户和项目，采用矩阵分解技术建立

用户-隐类、隐类-项目间的关系矩阵，利用矩阵乘积获取用户喜爱的项目并进行推荐。传统LFM研究侧重于减少数据稀疏和解决冷启动问题，如文献［ 1 ］针对LFM数据稀疏的问题，提出基于学习自动机的矩阵优化算法代替奇异值矩阵分解方法；文献［ 2 ］为减少数据稀疏性，采用基于隐类的似然估计法来优化LFM，在用户不了解相关知识的前提下，根据用户个性化需求定量化预测；文献［ 3 ］针对LFM的冷启动和稀疏性问题，提出融入用户属性的推荐算法，通过分类模型得到其他用户属性重要度，结合用户评分计算属性相似度并推荐；文献［ 4 ］针对冷启动问题，将历史浏览记录转化为用户评分，融入基于LFM的相似评分并推荐。上述文献

主要通过改进LFM来解决稀疏性和冷启动问题，以提高产品服务方案推荐的准确率。实际上，推荐技术不仅重视结果的精确性，也注重推荐过程的效率性，而文献［ 5⁃6 ］就是为提高推荐效率，引入服务方案因子约束的LFM模型，采用一阶线性方法拟合服务方案推荐结果；文献［ 7 ］在此基础上，采用Hessian工具中的二阶求解器获取产品的高斯逼近矩阵，既提高了推荐精度，又提高了推荐效率；文献［ 8 ］利用主题将潜在因子应用于查找项目关联的文本数据，建立潜在因素模型，提高用户查找项目的效率。本文基于文献［ 4 ］的推荐方法，引入偏置量，形成加权LFM。偏置量是由用户等主观因素引起的用户-隐类间的兴趣偏差值、隐类-产品服务方案间的评分偏差值。热门产品服务方案推荐过程往往忽略用户主观评分的偏差量，导致推荐结果未必符合最近邻目标用户真正的需求。本文的加权LFM算法基于矩阵分解技术，根据用户兴趣特征找出新用户的最近邻，无需新用户对产品服务方案的评分，就可以推荐最近邻的相应产品服务方案，从而解决用户冷启动问题。考虑新用户和最近邻用户兴趣特征的差异，求出兴趣特征的相

似度，作为整个最近邻用户兴趣值的权重；通过矩阵PQ和的积，得到用户偏好服务方案并推荐，改变了以往逐渐查找最近邻产品服务方案的方式，从而提高推荐效率。但是采用LFM算法推荐前，数据稀疏可能会影响推荐结果。当用户兴趣特征较多时，采用余弦相似度计算出的用户相似度就会偏高，难以体现用户间的差异。而云模型可以反映用户概念的模糊性、不确定性和随机性，较为完整地刻画用户特征。利用生成的用户云，通过计算云滴距离测度可以间接计算用户的相似性，从而弥补余弦相似度精度的不足。但是云滴数据

的生成过程也具有偶然性，单独应用云距离测度时准确性也受到约束。因此，本文提出采用正向云发生器求解出云滴，并将云滴距离和用户-特征间的余弦相似度的加权综合值作为新相似度，根据最近邻用户预测评分并填充空缺值，形成完整的数据集，从而提高数据的推荐精度。实际上，云相似度在个性化推荐技术中也有广泛的应用，如文献［ 9⁃11 ］基于云模型计算用户偏好的相似性并匹配目标用户进行推荐；文献［ 12 ］采用基于云的特征相似度计算方法，压缩数据，降低维度，节约存储空间；文献［ 13 ］采用云相似度的计算方法，结合反向传播网络进行预测。此外，云相似度也会在数据聚

集过程得到具体应用，如文献［ 14 ］采用基于云相似度和云的距离模型，处理并聚类语言变量，求解出群体偏好值，给出合适决策。因此，本文采用结合正向云的加权LFM推荐算法，既能减少数据稀疏，又能通过用户兴趣特征相似度解决冷启动问题，并

且能够通过LFM的矩阵分解技术，获取合适的推

荐产品服务方案，提高推荐效率。

由于传统LFM的研究未考虑数据库在动态更

新的过程中，推荐内容可能会随之改变的情况，因

此，本文提出采用动态增量更新机制，在不影响先

前数据处理工作的前提下，采用差值平均法对预

测公式更新产品服务方案推荐结果，降低时间复

杂度。本文针对传统LFM算法数据稀疏、冷启

动、未考虑实时更新等问题，采用云相似度预测填

充空缺数据，弥补稀疏性；采用基于用户兴趣特征

的相似度寻找最近邻用户，并获取最近邻用户兴

趣相似度作为用户兴趣特征的权重，结合用户评

分差异偏置量，约束主观评分差异性；通过LFM

方法获取用户产品服务方案评分并进行推荐；采

用差值平均法更新推荐结果，解决因数据库动态

更新导致推荐结果变化的问题，力求达到产品服

务方案实时推荐的效果。

1 研究框架为提高个性化产品服务方案的推荐效率，针对推荐技术中的稀疏性、冷启动以及未考虑实时更新等问题，本文考虑用户、方案与隐类间的关系，提出了加权LFM。首先，基于用户（ i= 1，2，…， s），方案a（j= 1，2，…， t）及隐类c（k= 1，2，…， n）的数据信息，采用正向云发生器，输入用户与隐类、方案与隐类的定性信息，输出用户-隐类的兴趣度矩阵P、方案-隐类的比重矩阵Q。将用户-方案评分划分成PQ和两朵云，采用云滴距离和余弦相似度的加权结果进行预测评分，填充矩阵P和Q的空缺数据。然后，考虑评分的偏置量，通过融

入偏置量的加权LFM模型建立用户-服务方案间的关系，输入PQ、矩阵，输出新用户对产品服务方案的预测评分并排名，选择前N项方案予以推荐。其中，新用户对服务方案的预测评分主要通过如下方式获得：基于新用户兴趣特征的相似度找出最近邻用户，将该相似度作为每个最近邻的评分权重，采用加权LFM方法获取新用户对方案的评分。为了深入了解用户需求，本文在LFM中添加一个成分：方案特征fg ( g = 1, 2, …, e )，并与方案构成产品服务方案-特征评分矩阵O，可以具体到某一服务方案特征的推荐优先性，精准地了解用户需求。最后，提出差值更新法对新用户评分数据进行实时更新，从而更新产品服务方案推荐。本文框架思路见图1。

图1 本文的框架

Fig.1 Frame diagram of this paper

2 基于云模型的数据处理

2.1 云模型相关概念

云模型是张光卫等提出的处理定性描述和

［］ 15定量概念间不确定性的转换模型，通过结合自然语言中的模糊随机性，实现定性语言与定量数值间的转换，为研究数据挖掘的不确定信息处理提供了新方法。为解决个性化推荐的稀疏性问题，本文考虑到产品服务方案评分信息的主观性和模糊性，提出采用云模型实现定性定量数据的转换，通过加权相似度对稀疏数据预测填充。云模型相关概念定义如下。

定义1 云和云滴设U是一个用数值表

［］ 1

示的定量论域， CU是上的定性概念。若定量值xU ∈ 是定性概念C上的一次随机实现， x对 C的确定度μx ( ) ∈ [ 0, 1 ]是有稳定倾向的随机数： μ:U → [ 0, 1 ]，∀ x ∈ U:x → μx ( )，则x在论域U上的分布称为云（ cloud），记为云Cx ( )；每个x称为一个云滴（ drop）。

定义2 正向云是将独立参数表示为云的数字特征，描述事务的不确定性。采用参数期望Ex、熵En、超熵He三个特征描述云，即C（ Ex，En，He），当随机变量x满足x~N（ Ex, E n）时，其中， En~N

（ En, H e），则对定性概念C的确定度满足μx ( )=

(- x Ex )

2 exp ( - )。

2 n论域上若干个云滴组成云，云滴对隶属度函数的映射是一对多转换的关系，不同于模糊聚类一对一的转换，云定性概念的整体特征由云滴表现出来。由参数（ Ex，En，He）表示云的数字特征模型，称为云模型。云模型的核心处理过程主要分两种：正向云发生器和逆向云发生器，正向云发生器主要将定性描述的整体向量C（ Ex，En，He）转换为描述个体定量数值的云滴，逆向云算法主要将定量数据转换为云滴（ x， μx ( )）。针对项目评分稀疏性，以及用户评分主观性问题，提出采用正向云算法，将定性评分转换为云滴，并利用云滴距离以及特征向量的加权相似度来预测未知评分，提高推荐精度。以云（ 0.5，0.05，0.01）的3个特征值及N= 1 000为输入值，通过正向云发生器输出云图，见图2。图2 正向发生器输出的云图

Fig.2 Cloud drop model

其中，期望Ex表示云滴在论域空间分布的期望值，即最能代表定性概念的点；熵En表示定性概念的不确定量，反映云的离散程度；超熵He是熵的不确定概念，可以描述云的厚度。

2.2 基于改进的正向云模型对稀疏数据填充

本文利用云模型的随机模糊性，将用户对产品服务方案主观评分转化为云滴，利用云滴距离和余弦相似的综合相似度对用户兴趣度矩阵P、方案评分矩阵Q预测填补空缺数据。假设云向量C （ Ex，En，He）表现为用户特征兴趣值，即Ex是用户对隐类的评分均值， En、He对应评分值的熵、超熵。通过引入云的综合相似度预测评分，填充用户评

· ·

分或隐类中方案比重的缺失数据。用户选择方案时，会选择高热搜度、推荐次数多的方案而忘记本身个性偏好，导致所获取的方案并没有实际用处。很多推荐算法对此引入罚函数来减弱外界影响因素，本文考虑用户兴趣多样性的影响，基于随机性的云滴距离来减轻用户偏好的影响，采用正向云发生器将云的特征值（（ Ex，En，He）转换为离散的云滴Drop ( xc, μ ( xc ) )，具体特征指标的计算方式如下：

Ex = Σ

xc （ 1） c =1

En = Σ - （ 2）

| xc Ex | c =1

He = S2 - E （ 3）

2 n

S2 = Σ ( - ˉ) xc x

2 c =1

式（ 1）~式（ 3）将定性描述转换为云的特征指标，本文采用正向云算法将特征指标转换为云滴，输入为表示定性概念的三个特征值（ Ex，En，He），输出为云滴Drop ( x1, μ ( x1 ) )， Drop ( x2, μ ( x2 ) )，… ， Drop ( xN, μ ( xN ) )， xc为处理后的评分值。具体过程如下： ①生成以En为期望值、He为方差的一个正

′

向随机数E n= N（En ， He）； ②生成以Ex为期望值、

′ ′

E 为方差的一个正向随机数x=N（Ex ， E n）； ③计n

-( xc - Ex )

算 μ ( xc ) = exp ( ) ,将带有确定度2E

2 n μ ( xc )的 xc称为数域中的一个云滴；重复步骤①~ ③ ，直到产生要求的N个云滴（ xc, μ ( xc )）， c= 1，2， …， N。

′ ′其中， N（Ex，E n）为生成以Ex为期望值、E n 为方差的正向随机数函数。给定云的3个数字特征值（ Ex，En，He）。上述算法可以生成任意云滴组成的正向云，比如用户u和用户v的特征向量Cu =

( Exs , Ens , Hes )， Cv = ( Ext , Ent , Het )。用户间的相似度可以用余弦相似度、皮尔森相似度、云距离测度等求解，考虑到余弦相似度局限于向量个体间的关系，忽略个体差异值的影响。皮尔森相似度实际上是数据中心化的余弦相似度，并不能针对离散的、差异大的数据点求解合适的相似度。云距离测度可以求解离散数据的相似度，但是忽略了核心用户的相似特征关系。因此，本文针对用户兴趣差异性问题，结合基于实际用户特征数据的余弦相似度和基于生成用户云滴数据的云滴距离测度，来计算最终的用户相似度，具体计算方式如下：

Cu × Cv sim c ( u, v )= （ 4）

|| Cu || || Cv ||

sim d ( u, v ) = Σ (- xuk xvk ) +( μ ( xuk )- μ ( xvk ))

2 2 k =1

（ 5） sim ( u, v )= αsimc ( u, v )+( 1 - α ) simd ( u, v ) （ 6） Spred = r u, +( r u, - ) sim ( u, v ) （ 7）

c c u

其中， simc ( u, v )是用户u和v评分向量的余弦相似度， simd ( u, v )是用户u和v评分映射的云滴距离测度， sim ( u, v )是由设定的权值α对 simc ( u, v )和 simd ( u, v )的加权综合相似度。r u, 为用户u对c

的评分， r v, 为用户v对c的评分，是用户u对所有

c u共同评分产品服务方案的评分均值，是用户v

v对所有共同评分隐类的评分均值， Spred 表示预测评分。本文通过正向云发生器获取云滴距离并与云的特征余弦相似度加权求和，来预测填充稀缺数据，提高个性化推荐的准确率。同理，产品服务方案对特征因子f的评估值为rac ，其计算方式类似于用户-隐类评分过程。例如，两朵云的特征向量 Cu =（0.5，0.05，0.01）， Cv =（0.6，0.055， 0.033），利用正向云发生器拟合出两者的云图，见图。3

图3 云模型

Fig.3 Cloud model

由图3可知，两朵云间距虽小，但Cu跨度小，离散程度低；而Cv跨度大，离散程度高。针对云滴距离的不确定性，本文采用云滴距离测度来预测并填充缺失数据有失准确度。引入特征向量间相似度以增加约束量并与距离相似度加权集合，以增加预测的准确度。如果某个用户数据有所缺失，可以利用该用户其他完整数据找出高相似性最近邻，进行预测填充，得到完整的用户数据。

3 基于改进LFM的个性化实时推荐

基于云模型处理后的用户数据，本文采用加权偏置量的加权LFM进行预测，即通过新用户的兴趣值来预测产品服务方案评分，并采用加权法优化预测评分结果。与其他推荐模型进行比较，以证明本文算法推荐方案的精度。

3.1 基于偏置量的LFM处理数据过程

LFM是奇异值分解矩阵的改进算法，算法基于用户项目间的隐含特征建立矩阵R。矩阵R的元素ruj表示用户u 对产品服务方案 j的兴趣度，本文通过计算并排序兴趣度，给予产品服务方案推 - r