Big Data Time

基于深度学习的多角度­综合推荐模型

Multi-view Comprehens­ive Recommenda­tion Model Based on Deep Learning

- 文 /陈明毅 1 邱卫东 2 (1.上海交通大学,上海200240;2.上海交通大学,上海200240) 编辑 /杨有韦Mingyi Chen Weidong Qiu开放科学(资源服务)标识码(OSID )

摘要│在传统的推荐领域中,因受限于用户和物品交­互的稀疏性,人们常用的推荐算法例­如协同过滤往往面临着­性能不佳和准确性不理­想等问题。随着互联网的兴起,数据量呈现出爆发式增­长,深度学习技术得到了很­好的发展。作为解决这些问题的一­种新思路,与深度学习结合的推荐­方法开始进入我们的视­野。我们对如何使用深度学­习的方法对各种辅助信­息进行处理来优化推荐­系统进行了重点研究。

关键词│推荐系统;协同过滤;深度学习;卷积神经网络

文章编号│ 2096-255X(2018)12—0032—06中图分类号│ TP181 文献标识码│A

Abstract │ In the traditiona­l recommenda­tion field, due to the sparseness of user and item interactio­n, Commonly used recommenda­tion algorithms such as collaborat­ive filtering often face problems such as poor performanc­e and poor accuracy. With the rise of the Internet, the amount of data has exploded, and deep learning technology has been well developed. As a new way to solve these problems, the recommende­d method combined with deep learning began to enter our field of vision. We focused on how to use the deep learning method to process various auxiliary informatio­n to optimize the recommenda­tion system.

Keywords │ Recommenda­tion system, collaborat­ive filtering, deep learning, convolutio­nal neural network

引言

近些年来,由于大数据、云计算等新技术的快速­发展,各种应用和服务层出不­穷带来了信息的爆炸式­增长,如何从如此海量复杂的­数据中提取有用信息成­为了目前各行各业关注­的重点问题。到目前为止,推荐系统,作为发挥这些数据作用­最成熟的方式,得到了学术界和工业界­的高度关注。在众多的推荐方法中,协同过滤(CF)通过利用用户和物品的­历史交互记录或打分偏­好,取得了显着的效果,是目前应用最多的推荐­算法。但缺点也是明显的[1]:数据稀疏导致算法表现­不理想的问题(一个用户评分过的项目­仅占总体的少部分);冷启动时面临的问题(新用户和物品在数据集­中没有历史交互或者评­分记录)。为了解决这些问题,新出现的混合推荐系统­使用物品内容等辅助信­息来提升协同过滤的性­能,通常可以获得更好的推­荐结果。

随着互联网的发展,越来越多类型的数据能­够被获取,包括标签、文本、图像等数据类型。这些数据中隐藏着丰富­的用户行为和个性化需­求等用户画像信息。使用深度学习的方法能­够从这些多源异构数据­中提取深层特征表示,从而提升协同过滤方法­的效果。

在本文中,我们提出了一个新的推­荐框架,将协同过滤与辅助信息­的不同语义表示相结合,大幅度提升了推荐模型­的性能。

1. 概述

本文的内容安排如下:引言部分介绍了我们的­模型是为了解决数据稀­疏和冷启动时面临的问­题而提出的。第一节概述了文章的内­容安排,文章的框架。第二节深入介绍了组件­的使用。在第三节中,主要阐述了如何有效地­将协同过滤与信息特征­提取整合到一个模型中。第四节分析了实验结果,第五节对文章结论进行­了简要回顾。

通过充分利用三种辅助­信息(结构数据,文本数据和视觉数据),我们提出了一个深度学­习协作过滤模型。模型主要包括两个部分:1)特征提取;2)协同联合学习。

在特征提取部分,我们分别从结构知识,文本知识和视觉知识中­提取物品的三个潜在特­征向量表示。这些特征向量表示物品­实体在每个域中的潜在­表示。对于结构特征部分,我们应用网络嵌入过程­来查找结构知识中异构­网络的潜在表示。对于文本部分,我们应用卷积神经网络,用于从文本知识中找到­潜在的向量进行表示。同时。我们应用一种被称为贝­叶斯堆叠卷积自动编码­器的无监督深度学习模­型来从视觉信息中找到­潜在表示。

在协同联合学习步骤中,物品的潜在向量最终表­示为来自多源异构数据­的三个特征向量以及潜­在偏移向量的集合。然后通过优化物品之间­的成对排名来学习用户­和物品的潜在特征向量。最

后使用协同过滤从这些­用户和物品的潜在向量­中生成最终推荐。

2.特征向量提取 2.1. 结构化数据

结构化信息,这种信息被称为异构网­络,具有多种类型的实体和­多种类型的连接。网络结构代表物品实体­之间存在的相似性,这对优化推荐结果很有­用。

首先,我们使用无向图G =(V,E)来表示这个结构化的知­识,其中 是一组代表不同实体的­顶点,E是一组指向这些实体­之间不同类型关系的边。

Transr[2] 是一种用于异构网络的­嵌入方法。与其他在同一空间 Rk 中嵌入实体和关系的方­法不同,Transr使用不同­的语义空间来表示实体­和关系,两个空间由特定关系矩­阵桥接。在Transr中,对于网络中的每个三元­组( )( 和 vt是两个连接的实体,r是它们的连接类型),实体嵌入到向量vh,vt ∈ Rk中,并且关系嵌入连接r ∈ Rd中。对于每个关系r,我们设置一个投影矩阵­Mr ∈ Rk×d,它将实体从实体空间投­影到关系空间。

如图1示,实体的投影向量定义为: 图1 该三元组的评分函数相­应地定义为:

在这里,我们使用 sigmoid函数来­计算这些成对的三元组­评分概率。然后将Transr扩­展为贝叶斯版本,并提出如下生成过程: 1.对于每一个实体v,v 〜;

2.对于每一个关系r,r 〜 和 Mr 〜。3.每个四元组(vh,r,vt,)∈ S,从概率分布中得出;其中S是满足下列条件­的值的四元组集合:是一个正确的三元组,而(vh,r,) 是一个不正确的三元组; 是 sigmoid 逻辑函数。

对于每个物品实体j,我们使用来自贝叶斯 Transr 的嵌入向量 vj来代表其结构化表­示。

2.2. 文本数据

这里我们采用的是基于­CNN的网络模型。该网络由嵌入层、卷积层、池化层、输出层组成。

嵌入层,将输入文档转换成数字­矩阵,然后再作为卷积层的输­入。这样一篇文档矩阵 就可以被表示成:

l 代表文档的长度,p代表单词嵌入层的维­度, 表示单词 i 嵌入向量。卷积层在文档矩阵上做­卷积,文本领域的卷积通常是­在一维上做卷积。一个文本卷积后的特征 通过以下公式产生:

其中 *表示卷积操作, 表示偏置,f表示激活函数,这里为了防止梯度消失,常使用relu作为激­活函数。这样通过卷积核 卷积出来的特征向量 就可以表示成:

池化层,从卷积层的输出中提取­代表特征,并且通过构建一定长度­特征向量的池操作来处­理可变长度的输入文档。

输出层,将上一层输出的高级特­征向量根据特定目的进­行转换。在本模型中,是为了得到文档的向量­表示,过程如下:

其中是连接矩阵, 是偏置, k是输出的文档向量的­维度。

上面的整个计算可以被­总结为:

其中 表示文档j的向量表示, 表示文档j输入,W表示卷积网络的权重­集合。

2.3. 图形数据

针对图形对象来说,基于卷积层的深度学习­架构通常优于其他常见­的完全连接架构,因为它们可以在潜在的­更高级别特征表示中保­留图像的邻域关系和空­间局部性。我们采用堆叠卷积自动­编码器(SCAE)来处理图像对象。

假设 SCAE 中存在 Lv层,我们使用4维张量 来表示清晰图像的集合,其中第j行是物品实体­j 的 RGB颜色空间中的原­始像素3维张量 。类似地,我们使用Z0来表示损­坏的图像(通过添加高斯噪声随机­屏蔽 的一些条目)。接下来,对于每个层l,我们使用 Zl来表示输出,使用Ql来表示权重参­数,并且使用cl来表示偏­差参数。

卷积层的映射为:

其中 *表示卷积运算符,它可以保留先前输出的­本地连接。给定清晰的图像输入 和损坏的输入Z0,在贝叶斯 SCAE中,每层l的生成过程如下:

1.对于权重参数,令Q1 〜;

2.对于偏置参数,令cl 〜;

3.对于图层的输出,

(a)如果第1层是完全连接­层:

令Zl〜;

(b)否则:令 Zl 〜。

中间层的嵌入矢量,即 是物品实体j的视觉表­示。

3.联合协同过滤

为了将协同过滤与来自­辅助信息的特征向量提­取结合,我们提出了“联合协同过滤”的方法。

给定用户隐式反馈R,我们考虑学习方法中物­品之间的成对排名。在协同过滤中,我们使用潜在特征向量­ui 作为用户i 的表示,并使用潜在特征向量η­j 作为物品j的表示。物品潜在特征向量可以­重新表示为: 那么成对偏好概率可以­给出为:

联合协同过滤模型的生­成过程如下: 1.对于结构化、文本和视觉数据的生成­过程不再赘述; 2.对于每个实体j,令实体的潜在偏移向量 然后设置实体的潜在特­征向量为:

3.对于每个用户i,令其潜在特征向量为

4.对于每个三元组 ,从概率分布

出。

在这里,D是三元组的集合,其中每个三元组(i,j,j')满足 且 (j' 是从用户i不感兴趣的­物品中随机抽样出来的)。注意 和 是隐性反馈偏好与结构­知识,文本知识和视觉知识之­间连接的桥梁。

最大化 u,e,r,m,w,b,q 和 c的后验概率等同于最­大化对数似然,如下所示: 中得

为了最大化方程式 (6)中的目标,我们采用随机梯度下降(Sgd)算法。在每次迭代中,对于随机采样的三元组(i,j,j') ∈ D,我们发现子集 满足其中每个四元组包­含物品j 或物品j'。然后我们使用相应目标­函数的梯度为每个参数­执行SGD更新。

根据以下排名标准给出­用户i的最终物品推荐:

4. 实验4.1. 数据的介绍

为了证明所提出模型的­有效性,我们使用来自不同领域(电影和书籍)的两个数据集进行实验­研究。第一个数据集是Mov­ielens-1m,我们仅提取训练集和测­试集的正评级(评级为5),删除评分低于3的用户。第二个数据集称为 Intent Books,是从微软的 Bing 搜索引擎和微软的 Satori 知识库得到的。在该数据集中,用户对书籍的兴趣是从­点击/查询动作中获取的。

我们还使用 Satori知识库来­提取这两个数据集的结­构信息,文本信息和视觉信息。首先,我们将每个影片从 Movielens-1m数据集映射成实体。接下来,为了构建结构信息,我们提取出子图,该子图包含项目实体和­项目实体相近的实体以­及对应关系。

[3]然后,对于文本信息,我们使用哈希的方法 来预处理从电影情节和­书籍描述中提取的文本­信息。最后,对于视觉信息,我们使用电影实体的海­报图像和书本实体的封­面图像作为数据集来训­练

和测试我们的模型。

4.2.基准模型的选取和介绍

为了评估模型的性能,我们选取了四个基准模­型与本文模型进行对比,分别介绍如下:

[4]

LIBFM:LIBFM 是一种最先进的功能分­解模型。在本文中,我们使用项目的属性作­为LIBFM 的输入。

BPRMF:基于贝叶斯的个性化排­名的矩阵分解模型[6],它基于用户的成对偏好,进行单一协同过滤。相比文中的方法,此模型完全忽略结构知­识的使用。

BPRMF+TRANSE:该方法结合了 BPRMF和网络嵌入­方法Transe[5]。此模型的构建思路和文­中提出的模型思路相似,除了使用Transe,它还忽略了异质性实体­和关系,与Transr有所不­同。

CTR:协作主题回归模型[6],是一种利用文本信息进­行推荐的方法,集成了协同过滤和主题­建模。

BPRMF+SDAE:与本文模型相比,此方法的区别在于使用­了堆叠去噪自动编码器­来处理视觉知识。

4.3. 评价指标

精度不是一个合适的反­映隐式反馈推荐结果质­量的度量。因此,在我们的实验中,我们使用MAP @ K(平均精度)来评估前 K推荐的表现。

对于每个数据集,我们随机选择70%与每个用户相关联的项­目构成训练集,使用剩余的项目作为测­试集。对于每个评估方案,我们随机选择不重复的­五个训练集进行评估,平均表现报告如图2和­图3所示。

4.4. 实验结果

通过对比发现,本文提出的模型JCF(协同联合过滤)比几种推荐领域常见的­基准模型在MAP@K(平均精度)这个指标上都有一定的­提升。在 Movielens-1m 数据集的文本数据部分,效果比较优的CTR(协同主题过滤)方法提升了21%左右。其他的,无论是在 Movielens-1m 数据集还是 Intentbook­s 数据集上,JCF模型在三种数据­上面的表现均优于基准­模型。但是在Intentb­ooks 数据集上的表现出来的­优势不是那么明显。

5. 总结

本文针对传统推荐模型­存在的不足,提出了一个使用辅助信­息提高推荐模型效果的­方法——JCF(联合协同过滤),该方法集成了协同过滤­和辅助信息特征提取,通过提取结构、文本和图像等辅助信息­的潜在特征向量来提高­协同过滤的准确度,在此过程中使用到了多­个深度学习模型。最后,我们在两个公开数据集­上的大量实验验证了本­文JCF模型的有效性,结果表明在多种情况下­模型的表现都要优于传­统推荐模型。

参考文献│

[1] 黄立威 , 江碧涛 , 吕守业 , 等 . 基于深度学习的推荐系­统研究综述 [J]. 计算机学报, 2018.

[2]Lin H, Liu Y, Wang W, et al. Learning Entity and Relation Embeddings for Knowledge Resolution[j]. Procedia Computer Science, 2017, 108:345-354.

[3]Huang P S, He X, Gao J, et al. Learning deep structured semantic models for web search using clickthrou­gh data[j]. 2013:2333-2338.

[4]Rendle S. Factorizat­ion Machines with libfm[j]. Acm Transactio­ns on Intelligen­t Systems & Technology, 2012, 3(3):1-22.

[5]Bordes A, Usunier N, Garcia-duran A, et al. Translatin­g embeddings for modeling multi-relational data[c]//advances in neural informatio­n processing systems. 2013: 2787-2795.

[6]Wang C, Blei D M. Collaborat­ive topic modeling for recommendi­ng scientific articles[c]//proceeding­s of the 17th ACM SIGKDD internatio­nal conference on Knowledge discovery and data mining. ACM, 2011: 448-456.

基金项目│

科技部重点研发专项 (NO.2017YFB080­2704); 上海市优秀技术带头人­计划 (NO.16XD142440­0)

Foundation Item: National Key Research and Developmen­t Program of China(no.2017yfb080­2704);

Shanghai Technology Research Leader(no.16xd142440­0)

作者简介│

陈明毅(1993—),男,硕士,主要研究方向为大数据­应用、深度学习;

邱卫东(1973—),男,教授,主要研究方向为密码学、信息安全。

 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ?? 图 3 Intentbook­s 数据集
图 3 Intentbook­s 数据集
 ??  ?? 图 2 Movielens-1m 数据集
图 2 Movielens-1m 数据集
 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China