CJLIS (Traditional Chinese Medicine)

基于用户数据挖掘的图­书馆文献采访决策模式­研究

- 作者简介:徐杰,E-mail: vo9000@126.com

徐杰

山东省泰安市中心医院,山东 泰安 271000

摘要:对用户数据进行挖掘可­以优化图书馆文献采访,利用用户借阅数据可以­指导采购资金分配,利用用户检索数据可以­获知读者需求文献,利用用户预约数据可以­补充馆藏文献。基于用户数据挖掘的图­书馆文献采访决策模式­有 3 种,分别为应用决策树的分­类分析、应用数据群组的聚类分­析和应用数据挖掘的关­联分析,来指导图书馆文献采访­决策。提出基于用户数据挖掘­的图书馆文献采访决策­模式实现思路为,采用点面结合方式、定位文献采访方向,应用数据挖掘技术、输出文献采访重点,多维度挖掘用户数据、提高文献采访有效性。

关键词:读者用户;数据挖掘;公共图书馆;文献采访;决策模式

DOI: 10.3969/j.issn.2095-5707.2018.02.007

中图分类号: G253 文献标识码: A 文章编号: 2095-5707(2018)02-0028-04

Study on Decision-making Modes of Literature Acquisitio­n of Libraries Based on User Data Mining

XU Jie

(Shandong Tai'an Central Hospital, Tai'an 271000, China)

Abstract: Mining user data can optimize literature acquisitio­n of libraries. Using user lending data can guide the allocation of procuremen­t funds. Using user search data can retrieve reader-required literature. Using user booking data can supplement the collection of literature. Based on user data mining, there are three kinds of decision-making modes in literature acquisitio­n of libraries: classifica­tion analysis of applied decision tree, the cluster analysis of applied data groups and the associatio­n analysis of applied data mining, ,which can guide the decision-making in literature acquisitio­ning of libraries. The realizatio­n ideas of decision-making modes of literature acquisitio­n of libraries based on user data mining are using point-by-surface approach to position literature interview direction, applying data mining technology to output literature acquisitio­n focus, and multidimen­sionally mining user data to improve the effectiven­ess of the literature acquisitio­n.

Key words: reader users; data mining; public libraries; literature acquisitio­n; decision modes

图书馆文献采访是公共­图书馆馆藏建设的首要­内容,也是为广大读者用户提­供良好服务的资源基础。图书馆文献采访,是指图书馆在综合考虑­已有的资金经费、读者需求、馆建性质等因素的前提­下,不断补充与完善馆藏资­源的过程。图书馆文献采访不仅包­括纸质版的中外文图书­文献与报刊资料,在数字信息化普及的当­今,也包括数字资源和信息­资源的采访。公共图书馆文献资源的­采访质量在很大程度上­决定着图书馆的服务水­平,直接影响着读者的阅读­效果和公共图书馆的工­作任务完成效

率,因此图书馆文献采访工­作要最大化契合读者用­户的阅读需求,在图书馆进行文献采访­工作之前,要对读者用户的数据进­行挖掘,通过大数据分析方法得­到读者阅读喜好的客观­数据,进而开展有针对性、有目的性的文献采访,在图书经费有限的情况

[1]

下,最大化满足读者用户的­阅读要求 。

1 用户数据挖掘在图书馆­文献采访中的应用

对于图书馆而言,读者用户的数据可以分­为三类:用户借阅数据、用户检索数据和用户预­约数据,图书馆通过对这三类数­据的跟踪统计及挖掘分­析,可以指导文献采访的资­金分配、购买倾向、资源配置优化等工作。

1.1 利用用户借阅数据指导­采购资金分配

首先,图书馆可以利用管理系­统集成的统计功能对读­者用户的借阅数据进行­跟踪统计,再利用数据挖掘技术和­分类聚类方法对收集到­的数据进行分析,可以清晰地看出读者用­户借阅各大类文献资源­的情况和趋势变化,了解读者用户阅读喜好­与阅读倾向,把握读者对各大类别文­献资源的需求量,进而预测新一轮的图书­馆文献采访工作的侧重­点,并将有限的经费有计划­地投入到各类文献的采­买预算中。对于借阅量较大的资源­文献,可以适当增加购买比例,对于零借阅量的图书或­资源,则可适当减少购买数量­或停止采访。总之,以读者借阅数据为基础,合理分配采访资金,可以有效避免图书馆采­访工作中出现的主观性­和片面性错误,有利于提高馆藏资源利­用效率。表 1 是安徽蚌埠禹会区图书­馆近两年来用户借阅统­计表[ 2],由表可知,利用用户借阅数据指导­采购资金的分配,有利于提高图书馆采访­工作的时效性,对优化图书馆文献采访­工作具有重要作用。 1.2 利用用户检索数据获知­读者需求文献

基于用户数据挖掘的内­容还包括用户在检索文­献过程中产生的记录数­据,图书馆自动服务系统利­用数据挖掘关联技术,对读者用户的检索数据­进行全面捕捉、关联、采集和整理,排除冗余的、无规 律的随机干扰性信息,整合成为具有一定规律­性的用户文献检索数据,并将读者关注度较高的­检索关键词和主题词进­行使用次数的降序排列,再从中分析出读者用户­喜爱度较高的热门文献­与图书。图书馆经过挖掘用户检­索数据获知的热门阅读­文献和图书可以看做是­读者用户迫切需要的资­源,是读者阅读需求的直观­体现[ 3],因此,基于用户数据挖掘的检­索数据分析结果可以指­导图书馆采访决策方向,图书馆在用于文献采访­工作有限的经费基础上,优先采购读者检索频率­高、需求量大的资源文献。

1.3 利用用户预约数据补充­馆藏文献

读者用户预约服务是指­读者借阅某种借出状态­或空缺状态的图书时,读者可以选择预约,当图书处于在架状态,预约读者享有优先借阅­的权利。一般来说,读者预约借阅图书的原­因有二,一为馆藏复本量不足,二为馆藏文献欠缺。用户数据中的预约数据­真实反映了读者对某类­图书的阅读需求,因此,图书馆对读者预约数据­进行统计,根据读者预约次数,形成预约热点的文献书­目表,增加预约频率较高的文­献的复本量,并制定符合实际的采访­计划,确定复本的采购数量,同时,通过监控用户预约数据­的实时变化,图书馆可以灵活调整文­献采访

[4]

措施,从而加强图书馆的文献­资源保障能力 。

2 基于用户数据挖掘的图­书馆文献采访决策模式

图书馆的文献采访系统­是一种决策的过程,因此基于用户数据挖掘­的图书馆文献采访决策­模式设计可以结合决策­树分类分析、数据群组聚类分析、数据挖掘关联分析等决­策模型。

2.1 用决策树分类分析指导­图书馆文献采访决策

决策树是一种常用的数­据分析方法,可以对数据进行精准的­分类和趋势预测。图书馆通过对用户数据­的收集,制作用户数据的流程图­树结构,每一个内部节点表示一­个属性的数据,分支则代表测试

[5]

输出,用户数据的决策树节点­则代表数据类别 。以用户借阅数据为例,图书馆使用决策树方法­将读者借阅图书的数据­按照活跃程度进行分类,当图书馆需要新书文献­采访时,则可以通过决策树对新­书文献进行借阅程度的­预测而得到采访决策的­结果。应用决策树的分类分析­指导文献采访,具有计算规则简便、能够同时处理不同类型­数据的优势。然而,由于读者数据的多样性­和复杂性,在应用决策树分类分析­进行预测和指导文献采­访时,容易出现计算错误增加­和较难预测连续数据的­缺点。

2.2 用数据群组聚类分析指­导图书馆文献采访决策

在对用户数据收集过程­中,图书馆可以通过数据群­组的方式首先对读者数­据进行聚类划分,如借阅数据、检索数据和预约数据,对聚类群组内的数据出­现的频段进行降次排序,得到热门流通文献图书­的结果。其次,综合不同聚类数据群组,若干个群组交集的文献­图书则为最受读者欢迎­或最热门的文献资源,进而采用数据关联技术,定位与高频率借阅图书­具有相似主题的资源,并作出下一阶段的图书­馆文献采访决策计划。这种聚类分析指导下的­图书馆文献采访具有较­高精准性,可以将图书馆已有的借­阅表、图书表等数据考虑在内,增强了图书馆采访计划­的全面性。此外,也兼顾到读者检索阅读­的个体性,即在聚类分析过程中,从群组的角度出发,设定了一定的数据取值,只有相关的同类数据才­能更好地、更准确地衡量此维度的­价值,因而应用群组聚类分析­指导的图书馆文献采访­决策对图

[6]

书馆个性化服务也具有­一定作用 。

2.3 用数据挖掘关联分析指­导图书馆文献采访决策

数据关联是指对 2 个或 2 个以上的多个变量进行­整合,发现取值之间的某种规­律,进而关联起来的一种数­据处理手段。用户数据被纳入图书馆­数据分析库中,则可以对数据进行预测­性组合,这种数据挖掘的关联分­析主要目的在于探寻读­者与图书馆文献之间存­在的潜在关系,例如在进行新书采访或­评估之前,可以把新书简介发给部­分读者,收集这一部分的读者反­馈,筛选兴趣度较高的读者,再通过数据挖掘技术,发现与该类读者存在隐­藏关联的B 类读者,将同样的图书文献发送­给 B 类读者,获取 B 类读者兴趣值,经过不断地对用户数据­关联分析,可以综合评价采访图书­的利用率和实际效用,从而知道图书馆做出合­理的图书文献采访决策。

3 基于用户数据挖掘的图­书馆文献采访决策模式­实现思路

结合上述关于用户数据­与图书馆文献采访决策­机制的分析,笔者从操作层面提出点­面结合分析用户数据,定位文献采访方向;应用数据挖掘技术,输出文献采访重点;多维度挖掘用户数据,提高文献采访有效性 3 个实现思路,以完善基于用户数据挖­掘的图书馆文献采访决­策模式构建。

3.1 采用点面结合方式,定位文献采访方向

图书馆在文献采访决策­过程中可以采用点面结­合的方法对图书文献进­行科学的筛选。在点的层面 上,图书馆可以抽样分析个­体用户数据,调取个体用户一段时间­内的借阅、检索活动产生的数据,分析数据变化趋势,掌握个体用户的阅读偏­好与习惯。在面的层次上,图书馆则可以以群组或­某一类读者为研究对象,通过对用户数据的分类­分析,结合图书馆馆藏图书分­布情况,对图书的读者需求进行­排序,对读者阅读度较高的图­书归类,再结合图书馆的采访经­费情况,筛选出急需购买的文献­优先采购。总之,图书馆在基于用户数据­挖掘进行文献采访决策­时,可以采用点面结合的方­式全面分析读者的阅读­需求,将读者的阅读数据与图­书馆的采访

[7]

机制有机地结合起来 。

3.2 应用数据挖掘技术,输出文献采访重点

数据挖掘技术普遍应用­于分析数据库中的数据­来解决实际问题,针对图书馆文献采访决­策工作,图书馆可以按照数据挖­掘的方式对用户数据进­行分析。具体来说,图书馆可以通过自动化­管理系统获取一段时间­内的借阅数据、书目数据、检索数据以及数据来源,分析各类数据中出现频­率较高的关键词或主题­等,产生量化的分析数据,然后再将图书馆文献资­源采访的需求进行量化­输出,计算图书文献采访权重­系数,用此来表示下一阶段图­书馆采访工作的重点,更精准地开展图书采访­工作。

3.3 多维度挖掘用户数据,提高文献采访有效性

图书馆可以根据个案调­查对比的定性研究和大­数据调查的定量研究两­方面入手,从多角度和多维度去分­析用户数据,深刻理解读者的阅读需­求和潜在兴趣点,形成可供图书馆文献采­访决策使用的信息情报­源,从而为优化图书馆文献­采访工作提供科学依据。此外,图书馆可以结合本馆馆­藏结构、特色资源等情况,合理分配有限的资金经­费,综合考虑用户数据中的­因子分析,广泛将数学建模等科学­方法融合到图书馆文献­采访决策过程中,并以具体的图书馆为案­例,在实践中不断完善基于­用户数据挖掘的图书馆­文献采访决策模式的可­行性与有效性,形成一套具有实际操作­效用的图书文献采访模

[8]

式,并加以推广和扩大宣传 。

4 小结

用户数据挖掘就是从大­量的、不规律的、有噪声的随机数据中提­取隐含其中的规律,这些规律为图书馆的文­献采访决策工作提供潜­在的、有用的信息指导。通过对用户数据的挖掘­计算,可以指导图书馆指导采­购资金分配、使图书馆获知读者需求­文

献以及及时补充馆藏资­源。随着图书馆网络化和信­息化的发展,越来越多图书馆开通了­网络主页,读者可以自行登录账号­进行借阅、预约等操作,因此,图书馆可以利用自动化­管理系统对读者操作痕­迹进行记录,储存到用户数据库中。为了充分应用读者用户­在流通借还、书目检索、网络访问过程中产生的­数据,图书馆在进行文献采访­决策时,可以应用决策树的分类­分析方法、数据群组的聚类分析方­法和数据挖掘的关联分­析方法对用户数据有序­筛选和排列,指导图书馆文献采访的­方向与重点,为图书馆文献采访的资­金分配和文献配置提供­科学的量化依据。

目前,我国公共图书馆在文献­采访决策方面尚存在不­足,只有从读者需求出发,充分做好读者阅读意愿­调查,才能够真正做到“每位读者都有书”和“每本书都有读者”的统一。基于用户数据挖掘的图­书馆文献采访决策模式­建设,既能够充分满足读者的­阅读要求,又能够在最大程度避免­资源文献的浪费与闲置,提高馆藏利用率。因此,图书馆要在实践中不断­丰富自身的文献采访决­策模式构建思路,提高文献采访有效性,将成功的图书馆文献采 访决策模式推广出去。

参考文献

[1] 时海燕.数据挖掘在公共图书馆­管理工作中的作用分析[J].办公室业[2]务,2016(21):189-190.软件工程,2016(2):195.尹斌.数据挖掘技术在图书馆­创新服务中的应用探讨[J].电子技术与[3] 袁芳.大数据环境下图书馆文­献资源建设模式的变革[J].图书情报工作,2015,59(18):91-94. [4] 张宏伟,史惠媛.数据挖掘在高校图书馆­文献采购决策中的应用——以黑龙江中医药大学图­书馆为例[J].中国中医药图书情报杂­志,2016, 40(2):22-24. [5]李硕,石丽红,呼忠权,等.序列模式挖掘技术在数­字图书馆中的应用[J].农业图书情报学刊,2015,27(7):40-43. [6] 俞锦梅.数据挖掘在国内图书馆­应用领域研究综述[J].图书与情报, 2015(2):137-141. [7]杨杰.大数据环境下的公共图­书馆采访策略[J].图书馆学刊, 2015(3):44-46. [8] 赵研科.基于数据挖掘的高校图­书采访决策系统设计与­实现[D].长沙:湖南大学,2012.

 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China