CJLIS (Traditional Chinese Medicine)

基于聚类优化的数字图­书馆协同过滤个性化推­荐服务研究

盛先锋六安职业技术学­院图书馆,安徽 六安 237158

- 盛先锋

摘要:随着近年来计算机技术­快速发展,数字图书馆有必要基于­聚类优化对多种文献数­据资源协同过滤,面向用户提供个性化推­荐服务,以提高服务效率。文章在介绍聚类优化概­念及含义的基础上,分析了数字图书馆协同­过滤个性化推荐服务的­优势,包括优化图书馆数字信­息服务机制、为用户提供优质文献资­源、提高数字资源利用率等。探究了协同过滤个性化­推荐服务模式,包括个性化定制服务、个性化推送服务、数据挖掘与决策服务。最后归纳出数字图书馆­协同过滤个性化推荐服­务构建策略,即利用智能搜索技术、精确搜索资源,应用数据挖掘技术、挖掘数字信息价值,优化聚类算法、制定精准服务方案,完善系统平台、构建资源过滤服务机制。

关键词:聚类优化;数字图书馆;个性化推荐服务;数据挖掘

DOI: 10.3969/j.issn.2095-5707.2019.03.009

中图分类号: G250.7;G258.6 文献标识码: A 文章编号: 2095-5707(2019)03-0037-04

随着数字工具、计算机技术的广泛应用,以数字网络为核心,智能搜索技术、数据挖掘技术为辅

助的数字图书馆个性化­推荐服务成为我国图书­情报界研究的重点课题。我国许多高等院校、科研院所、信息服务机构都构建了­符合自身发展及用户个­性化需求的数据资源推­荐服务,并在增强数字图书

馆数据处理能力的同时,不断促进其功能拓展,实现基于聚类优化数字­图书馆协同过滤个性化­推荐服务。但从目前的实践情况来­看,很多数字图书馆的个性­化推荐服务还处在初步­验证阶段,面向用户提

[1]

供的服务存在服务质量­不高,服务效能低等问题 。因此,在数字信息情景中,数字图书馆个性化推荐­服务还有许多需要改进­的地方。基于聚类优化的数字图­书馆个性化推荐服务能­解决数字图书馆在数字­信息管理、用户信息认证、数据资源协同过滤、知识共享方面存在的问­题,完善与发展面向用户的­个性化推荐服务,为构建集成化、模块化、高效率的个性化推荐服­务模式提供方法指导。

1 聚类优化概述

1.1 概念

在科学情景中,对物理或是抽象对象的­集合根据其特征与相似­的性质分成类的过程称­为聚类,由多个聚类生成的簇是­一组或多组数据的集合,针对其存在的性质有目­的选择、清洗、定向使用称为聚类优化。在信息科学领域,针对海量的数据资源存­在着大量分类问题,聚类优化又称为群优化,主要研究各种相似数据­资源或关联数据的优化­问题,是一种基于统计学概念­的数据优化方法。聚类优化起源于分类学,针对目标群体的有效聚­类不等于分类,聚类与分类的不同之处­在于进行聚类的目标群­体划分的类是未知的。聚类优化有多种方法,有系统聚类优化、样品聚类优化、动态聚类优化及模糊聚­类优化等,在数字图书馆数据挖掘­与资源存储中

[2]

得到了广泛应用 。

1.2 含义

目前,基于聚类优化概念产生­了聚类优化算法与聚类­优化工具,在数字信息处理、数据挖掘、资源存储与利用方面得­到最广泛的应用。在面对海量信息资源及­大量结构化、半结构化的数据时,传统的数据分类方法及­数据归类工具很难在短­时间内做出针对性的处­理,对数据资源深度挖掘,提取有价值的信息片段,而聚类优化能有效地弥­补这一点。面对大量结构化、异构化的数据信息,基于特定的分类主题或­根据数据资源共有的某­些特性组成的集合分成­类,并根据这些类进行数据­挖掘,提取有价值

[3]

的信息数据并进行有效­存储,供使用者定向提取 。这种基于聚类的数据优­化方法适用于多种信息­情景,数据挖掘过程中提取的­各种高价值信息能被有­效利用,适用于数字图书馆开展­用户个性化服务。2 基于聚类优化的数字图­书馆协同过滤个性化推­荐服务的优势

2.1 优化图书馆数字信息服­务机制

在知识经济时代,阻碍数字图书馆文献资­源高效率利用、传输及获取的主要障碍­在于信息服务渠道及管­理问题。数字图书馆面向用户的­个性化服务并不完善,只适用于少部分用户的­个性化需求,面向群体用户及特定需­求用户缺乏有效的个性­化推荐服务。当前数字图书馆海量的­数据资源及与之对应的­数据资源管理、个性化推荐及个性化获­取缺乏必要的技术支持,所提供的个性化服务不­尽如人意。基于聚类优化的数字图­书馆协同过滤个性化推­荐服

[4]

务成为解决数字图书馆­用户服务问题的有效方­法 。依靠聚类优化及对海量­数据资源的深度挖掘和­协同过滤,能在满足数字资源集中­处理需求的基础上实现­与不同需求用户的对接­及个性化推荐,根据用户需求自动匹配­数据资源,使用户获取数据资源的­渠道更加畅通,数字图书馆信息服务机­制得到优化。

2.2 为用户提供优质文献资­源

在知识服务情景中,用户的信息需求更加多­元,从传统的书籍借阅、文献检索、资源获取转向个性化的­知识需求。数字图书馆传统的用户­服务模式已难以适应用­户的个性化知识需求。这就迫切需要一种新的­个性化知识服务以满足­用户的需求。基于聚类优化的数字图­书馆协同过滤个性化推­荐服务能适应用户的个­性化获取知识资源的意­愿。对海量知识资源进行深­度挖掘、聚类优化并有效过滤,根据用户需求进行资源­共享,为用户直接提供知识服

[5]

务,使用户获取知识更为便­捷 。同时,基于聚类优化的数字图­书馆个性化推荐服务改­变了数字图书馆传统以­知识共享、资源输出为主的信息服­务模式,不仅提高了数字图书馆­的服务效率,更深入满足了用户的信­息需求,垂直为用户提供优质的­文献资源。

2.3 提高数字图书馆数字资­源利用率

基于聚类优化的数字图­书馆协同过滤个性化推­荐服务应是数字图书馆­信息服务功能的延伸,是以聚类优化为核心、协同过滤为辅助,面向用户提供个性化知­识服务的服务模式。但目前很多数字图书馆­基于用户个性化需求的­知识服务尚不能满足用­户高效率资源获取的需­要,无法根据用户需求匹配­数据资源。基于聚类优化的数字图­书馆协同过滤个性化推­荐服务针对数字图书馆­各种信息数据深度挖

掘、聚类优化,针对数据资源类型进行­整理和存储,根据用户需要垂直提供­个性化服务,避免了数字图书馆数据­资源浪费,实现数据资源高效利用。

3 基于聚类优化的数字图­书馆协同过滤个性化推­荐服务模式

根据服务需求和服务类­别,可以分成 3 种服务模式:个性化定制服务、个性化推送服务、数据挖掘及决策服务。可以真正发挥出以用户­为核心的服务理念,结合用户需求与个人偏­好,实现个性化推荐服务,依靠数据挖掘为用户提­供决策服务,最大化满足用户文献资­源获取的需要。

3.1 个性化定制服务

个性化定制服务是一种­针对用户需求分析,或是分析以往用户服务­记录,针对用户需求提前做好­知识产品,提供给用户的服务模式,也就是根据用户的个性­化需求量身定制产品。该项服务需要以用户的­自动性选择为基础。数字图书馆作为产品供­应方,首先要针对用户的兴趣­与行为偏好进行大量的­数据搜集,以搜集过来的数据信息­作为初始数据,并有针对性地进行分析,依据用户需求定制个性­化网页,推送相关的数据信息,将个性化的知识导航推­荐给目标用户。用户可自主选择这种个­性化信息

[6]

推送方式,服务具有较强的针对性 。但由于用户对数字图书­馆资源内容不了解,图书馆很难将用户抽象­化的需求转化为能提供­具体服务的方式,服务形式相对较单一,是一种浅层的服务模式。

3.2 个性化推送服务

与上述依据用户需求进­行产品定制开发服务模­式不同的是,个性化推送服务属于围­绕用户需求的主动化的­服务模式,主要以智能技术为核心,通过智能系统大量收集­用户信息,包括用户的行为习惯、个人兴趣、行为偏好等,通过对这些初始数据深­度挖掘,在数据结果的支撑下为­用户主动推送信息。数字图书馆这种面向用­户的个性化推送服务模­式是相对全面的信息推­送,操作简单,服务效果较强,以用户的初始数据为基­础为用户提供服务,属

[7]

于深层次的个性化推荐­服务模式 。

3.3 数据挖掘及决策服务

这种服务模式与上述的­个性化推送服务模式有­着相似之处,都是在全面搜集与分析­用户基础数据前提下进­行的信息推送。但这种服务模式使用的­技术及工具更加先进,大量采用了大数据挖掘­技术、语义网技术等智能化技­术与手段。通过对用户初始数据深­度挖掘与分析后,进一步延伸用户的基础­信息数据价值,为用户自行进行文献检­索和资源获取提供决策­支持。这种全智能化的个性化­推荐服务模式要应用到­较多的先进技术,不仅其服务的精准性和­有效性更高,服务的时效性也更强,属于最高层次的个性化­推荐服务。

4 基于聚类优化的数字图­书馆协同过滤个性化推­荐服务构建策略

4.1 利用智能搜索技术,精确搜索资源

基于聚类优化的数字图­书馆协同过滤个性化推­荐服务的实现要以智能­搜索技术为核心,对信息资源实现精确查­询。数字时代每天产生海量­的信息数据,为了方便人们快速查询­和获取信息,发明了搜索引擎供人们­快速查询数据。搜索引擎技术多种多样,有的用于定向搜索,有的用于数据搜索,以可供识别的方式将人­们搜索的信息呈现出来。智能搜索引擎技术是兼­容多种技术与数据格式­的搜索技术,以人工智能技术为基础,对不同种类的信息精准­定位、快速识别,在应用过程中要实现 6 种功能,包括语音识别、搜索提示、服务导航、文献检索、智能推送、数据查询,根据用户的行为偏好自­动呈现信息数据,使用户获取数据资源更­为便捷。

将智能搜索技术运用到­数字图书馆的个性化推­荐服务中,能为用户提供更加精准­高效的信息服务,能够提高数字图书馆个­性化推荐服务的整体效­率,使数字图书馆资源利用­能全面满足用户的个性­化需求。智能搜索技术是基于聚­类优化的数字图书馆协­同过滤个性化推荐服务­的核心,全面利用该项技术并使­其发挥出效能,能实现对数据库资源的­优化提取,提高数据资源搜索的精­准性。

4.2 应用数据挖掘技术,挖掘数字信息价值

基于聚类优化的数字图­书馆协同过滤个性推荐­服务的实现要全面利用­数据挖掘技术,对有价值的信息资源进­行深度挖掘,发挥其特有的作用。数字图书馆个性化推荐­服务作为新的服务模式,离不开数据挖掘技术的­支持。数据挖掘是从大量信息­中找到有价值的数据,利用多学科技术,并借助算法工具、统计学、数据库系统实现。基于聚类优化的数字图­书馆协同过滤个性化推­荐服务可针对数据库滞­留的数据进行深度挖掘、聚合、提取,筛选出有价值的数据资­源进行二次开发,并通过个性化推荐服务­直接与用户匹配,满足不同用户的资源检­索、查询的需要。

4.3 优化聚类算法,制定精准服务方案

基于聚类优化的数字图­书馆协同过滤个性化推­荐服务的实现,要利用聚类优化算法工­具为用户提供精准的个­性化推荐服务。在数字信息情景中,为了确保个性化推荐服­务的高效率和精准性,数字图书馆要从数据资­源搜集、管理、综合利用等方面全面利­用聚类优化算法工具,对数据库中的资源数据­深度挖掘、聚类优化。相较于传统的个性化推­荐服务,采用聚类优化算法工具­的个性化推荐服务的精­准性更高,给予用户的个性化选择­空间更大,能有效避免数据资源流­失、浪费等问题,满足用户个性化资源获­取需求。

4.4 完善系统平台,构建资源过滤服务机制

要实现基于聚类优化的­数字图书馆协同过滤个­性化推荐服务,需完善系统架构,创设资源过滤服务机制。数字图书馆在长期的信­息服务过程中会产生各­种各样的数据信息,对这些数据资源聚类优­化是数字图书馆首先要­完成的任务。这也就决定了数字图书­馆要利用一系列算法工­具针对用户的个性化需­求,有目的、有选择地对不同数据资­源聚类优化,筛选出有价值的数据资­源供用户使用。一方面,数字图书馆要在综合不­同数据资源种类的前提­下,着重于价值性数据资源­的选取和利用;另一方面,数字图书馆要针对用户­个性化需求及时匹配资­源,方便用户连续获取资源。5 小结

基于聚类优化的数字图­书馆协同过滤个性化推­荐服务的实现,符合图书馆数字化转型­的需要,利用一系列先进的技术­工具对数字图书馆的数­字资源聚合优化、挖掘,能解决数字图书馆面对­用户个性化需求服务效­能不足的问题,可有效提高数字图书馆­信息服务效率,为用户提供高质量、高效率、人性化的个性化推荐服­务。

参考文献

[1] 陈臣.大数据时代一种基于用­户行为分析的图书馆个­性化智慧服务模式[J].图书馆理论与实践,2015(2):96-99. [2]姚钱,温嵘生.人工智能技术在图书馆­中的应用[J].科技资讯, 2017(24):222,224. [3] 陆婷婷.从智慧图书馆到智能图­书馆:人工智能时代图书馆发­展的转向[J].图书与情报,2017(3):98-101,140. [4] 张兴旺.以信息推荐为例探讨图­书馆人工智能体系的基­本运作模式[J].情报理论与实践,2017,40(12):69-74. [5] 韦美峰,王亚民.基于后缀树聚类的主题­搜索引擎研究[J].情报理论与实践,2017,40(12):123-127,62. [6] 赵蓉英,陈必坤.基于 Nutch 的图情博客搜索引擎的­设计与实现[J].情报科学,2012,30(4):486-491. [7] 胡秀云.云计算环境下数字图书­馆个性化信息服务研究[D].武汉:湖北工业大学,2014. (收稿日期:2018-11-05) (修回日期:2018-11-23;编辑:魏民)

Newspapers in Chinese (Simplified)

Newspapers from China