图书馆实施大数据战略实践路径分析

赵振营河南中医药大学网络信息中心,河南 郑州 450046

CJLIS (Traditional Chinese Medicine) - - NEWS - 基金项目:河南省软科学研究项目(162400410097)作者简介:赵振营,副研究馆员,研究方向为信息资源管理。E-mail: ZhaoZYHN69@163.com

摘要:文章结合大数据时代的客观要求分析图书馆实施大数据战略的必要性与可行性。从数据的分析与整合、大数据处理以及结果显示 3 个阶段探究图书馆实施大数据战略的框架,并着重从数据资源建设、数据处理技术和数据流通传输 3 个方面提出实施大数据战略的路径,即扩大图书馆数据存储量,丰富数据资源种类;提高图书馆数据处理技术,合理应用网络环境;促进图书馆数据传输,搭建资源分享网站。以期推动图书馆大数据战略的发展和进步。

关键词:图书馆;大数据战略;构建;路径分析

中图分类号: G250.7 文献标识码: A 文章编号: 2095-5707(2017)02-0035-04

Analysis on the Pathway of Implementing Big Data Strategy in Libraries

ZHAO Zhen-ying

(Network Information Center, He'nan University of Traditional Chinese Medicine, Zhengzhou He'nan 450046, China)

Abstract: Combined with the objective requirements of the era of big data, this article analyzed the necessity and feasibility of implementing big data strategy in libraries. It explored the framework of implementing big data strategy in libraries from the three stages of analysis and integration of data, big data processing and, results display, and proposed the pathway of implementing big data strategy in libraries mainly from the aspects of data resource construction the data processing technology, data transmission and circulation, namely the expansion of the library data storage, enrichment of data resources; improvement of library data processing technology, reasonable application of network environment; promotion of library data transmission, construction of resources sharing website, with a purpose to promote the development and progress of big data strategy in libraries.

Key words: libraries; big data strategy; construction; analysis on pathway

大数据( Big Date)意为“大量的、大规模的、多类型的数据”,这个名词是随着信息时代来临而不断演变发展的,我国各行各业的数据化转型标志着数据时代已经到来。在这种时代背景下,图书馆也开始向数据化转型,图书馆原有的数据建设大多局限于数据数量的多少,倾向于强调“海量数

据”,而对于数据内容的质量评估、服务方式的数据采集及不同图书馆之间的数据资源输出平台方面鲜少涉及。

大数据时代的到来,一方面要求图书馆降低数据构成的成本,体现出数据资源可再生成、绿色环保使用的特点,另一方面要求图书馆提高数据构成的质量、增加数据介质类型。可以说,大数据战略

[1]颠覆了传统图书馆的建设和服务 。广泛意义上讲,图书馆实施大数据战略可分为两大部分:资源的数据构成和服务的数据构成。一般来说,图书馆

更侧重于资源的数据构成分析。本文从 2 个层面对图书馆实施大数据战略的构建与实现路径进行了探讨,希望以一种新的视角分析图书馆大数据战略,并从不同角度推动图书馆大数据战略的实施。

1 图书馆实施大数据战略的必要性与可行性

图书馆实施大数据战略既是图书馆转型的自身需要,也是大数据时代的客观要求,与此同时,技术支持和政府支持为图书馆实施大数据战略带来了可行性条件。

1.1 必要性

首先,图书馆的现代化建设与发展需要多种多样的数据资源。大数据时代隐含的资源数据化、服务信息化决定了未来图书馆的服务指向网络化和数字化偏移,纸质文献的数据化处理以及数据库成为现今图书馆资源构建的重要部分,各种结构化和非结构化的数据信息丰富了图书馆的文献资源,以互联网为平台的数字化虚拟服务也成为图书馆发展的新天地。因此,图书馆实施大数据战略是图书馆自

[2]

身转型的必然要求 。其次,在大数据时代,图书馆必须掌握对文献的数字处理技术,包括数据的储存、格式转换、输入输出和分析整合等,图书馆的核心是资源,只有具备丰富的资源才能提高图书馆的核心竞争力,增强读者用户对其的粘性。图书馆大数据战略的数据处理技术还包括对读者用户资源获取的指导,精准的数据分类和推送,有利于提高

[3]

图书馆的服务质量、提高文献资源的利用率 。

1.2 可行性

图书馆实施大数据战略的可行性条件包括 2 个方面:技术支持和政府支持。在技术支持方面,图书馆能够实现纸质文献的数据化处理或数据库建设,前提是要实现先进的数据处理技术,即高性能的资源云中转和 PB 级海量数据传输平台。目前,国内大多数图书馆具备高速的网络条件和数据资源转化技术,部分偏远地区的图书馆也可依靠购买数据库实现数据资源建设工作。因此,充分的技术支持为图书馆实现大数据战略提供了可行条件。在政府支持方面,由于图书馆的数据建设和信息化服务涉及的领域广泛、参与的部门较多,是一次地方文化机构知识输出的大变革,因此引起了地方政府的关注,政府在资金、政策上给予了相应的帮助和指导,如安徽蚌埠市图书馆在数据建设上与地方档案馆、博物馆形成了合作关系,图书馆在政府牵头下获准将档案馆的纸质资料数据化并呈现于网络平台 上,此外,还与环保部门、地质部门进行合作,将

[4]

其数据或模型用于图书馆的数据库建设 。政府的支持为图书馆实施大数据战略提供帮助,是图书馆向现代化转型的又一动力。

2 图书馆实施大数据战略实践的框架构建

图书馆实施大数据战略实践的框架构建包含 3

个阶段:数据的分析与整合、大数据处理及结果显示,其中数据分析与整合是核心,大数据处理是技术层面要求,结果显示为数据的输出(见图1)。 2.1 数据的分析与整合

图书馆对数据的分析与整合是指将分散多个平台和不同类型、介质的数据进行筛选整理,排查重复无效的数据资源,整合分类数据信息,以及对不完整的数据进行补充,是提高数据质量的前期阶段。图书馆数据的分析与整合需要依靠云数据储存平台,也可以将其成为中转平台。大数据战略下,这种数据载体至关重要,是数据库建设的临时文件

[5]

夹,以此实现数据的存储与交流 。具体来说,图书馆实施大数据战略时,对于数据的筛查和补充为后续的数据处理与结果显示奠定了基础,是资源构建的核心环节。传统的数据库建设,往往由于数据的无序和重复造成利用率和准确率的降低,资源分布的分散同样会增加图书馆服务任务量,难以精准定位读者用户的资源需求,是数据服务体系上要解决的问题,图书馆大数据战略下的数据分析与整合环节对于资源的科学构建起到了促进作用,方便图

[6]

书馆的管理和读者用户的使用 。

2.2 大数据处理

图书馆大数据处理环节建立在资源的分析和整合层面上,即收集海量数据信息,并通过信息之间的关联建立发散性联系与链接,如果 2 个数据在语境或主题某一方面有交集,在数据建设时即为 2 个数据设置相关联系,建立二者之间的信息聚合,完成读者的知识获取和服务延伸功能。在大数据处理环节,图书馆要依靠特殊软件和特殊技术的支持,如 Hadoop 系统以及跨库检索等等[ 7],既要对数据信息进行宏观的整合的链接,又要对不同层面、上下文之间进行关联,实现数据全方面的延展和内在分析处理。除此之外,语境搜索和数据仓库也是图书馆实施大数据所普遍采用的数据处理软件,经济高效分析 PB 级结构化与非结构数据是语境搜索的优势所在,有利于增强各节点之间的显性或隐形联系,提高数据库的完整性和网络覆盖性,将各节点文件进行新生或覆盖,并将新产生数据纳入数据库中,体现了图书馆大数据战略的全面优化和数据数量、质量的双向提升。

2.3 结果显示

结果显示是图书馆实施大数据战略实践的最后阶段,又可具体分为 2 个部分。⑴数据可视化,所谓数据可视化是指图书馆对数据分析整合以及处理后,呈现出来的处理结果,既可为数据库建设内部工作人员所查看,内化为图书馆大数据战略的管理系统组成部分,也可将可视化的原始数据提交给用户,直接为用户服务。⑵数据分析,可包括对数据本身的分析,也包括对数据发展的预测和内容节点联系的评估与改善;此外,数据分析结果还能够为图书馆大数据战略的改进提供直接的建议。一般来说,图书馆侧重于数据内容的分析,实际上,数据预测更有利于推动图书馆的现代化和数据化转型,

[8]

更有利于改善图书馆服务、提高读者粘度 。

3 图书馆实施大数据战略实践的路径

笔者对图书馆实施大数据战略框架构建探究,从数据资源建设、数据处理技术和数据流通传输

3个方面提出了实施的路径。

3.1 扩大图书馆数据存储量,丰富数据资源种类

数据资源是图书馆实施大数据战略的核心,大数据战略需要图书馆对数据资源进行初步的分析和整合,在这一环节,图书馆需要对本馆自建数据库和外购数据库的资源进行筛选排查,过滤掉无法读取的、无效的、重复的甚至过期的数据资源,保留 完整的资源文献,进行广义分类,如文史类、社科类、财经类或哲学类等等,再对数据的形式进行划分,如文本文档、音频文件、视频文件等等;此外,还可以采用等级分类法,如加密等级、珍贵史料、普通等级等等。图书馆实施大数据战略的路径最终是要从数据资源入手,充实馆内的数据文献。在具体的数据资源建设过程中,根据本馆的实际情况进行资源配置,如适当增添自身缺少的资源内容,减少过多的同类资源等等。

3.2 提高图书馆数据处理技术,合理应用网络环境

图书馆实施大数据战略的另一表现在于服务内容和服务方式的数据化。2012 年,郑州金水区图书馆引进 1800 高性能计算机系统[ 9],采用先进的数据处理技术,为该馆海量数据资源重新编目,为读者呈现了耳目一新的服务内容。其中,一级检索更为细化,在一级检索结果中就呈现出不同节点和不同主题链接到的相关文献,以网络思维图状表达出来,促进了读者用户的知识迁移。同时简化了读者用户的检索过程,将数据资源进行更为全面的关联整合。此外,图书馆的服务方式也日趋网络化,目前我国大多数图书馆都开通了官方主页,在主页上设置了“数据库资源”一项,读者可自行利用网络环境访问图书馆数据库,获取相关资源,这种摆脱了时间与空间束缚的自助阅读被广泛使用,集中体现了大数据环境下图书馆服务的快捷性、便利性与

[10]

人性化特点 。

3.3 促进图书馆数据传输,搭建资源分享网站

大数据环境将不同地域的图书馆连接为一个整体,网络的沟通无障碍体现在图书馆之间资源的相互交流与共享。图书馆大数据战略一方面在于构建本馆的数据库、形成本馆的数字化服务,另一方面则是依托网络平台,实现资源配置的优化和馆际之间互通有无。2014 年,山东潍坊市牵头山东沿海地区的市级图书馆形成了区域内的图书馆联盟,并构建资源共享网站,使得数据的实时流通成为现实,读者可根据自己的需要向图书馆申请阅读请求,图书

[11]

馆则将读者所需内容发送到读者预留的邮箱中 。由此可见,图书馆的大数据战略推动了数据传输,真正实现了资源共享。搭建资源共享网站,是对独立个体的图书馆数据处理技术和计算机应用技术的检验,它有利于推动形成广义的图书馆间联盟,有利于落实大数据精神,有利于促进图书馆的共同发展和转型,更有利于为读者用户提供优质高效的服务。

4 小结

大数据时代为图书馆摆脱传统服务内容和服务方式提供了契机,图书馆的资源优势、技术优势、政府支持,为实施大数据带来可行性条件,有助于图书馆服务贴合读者用户的实际需求,增强图书馆的核心竞争力。

与此同时,发展过程中出现的各种矛盾和问题,给我们提出了新的挑战。数据资源建设是实施大数据战略的重点;数据处理技术是实施的保障;数据内容和整合决定其成效;资源质量的优劣决定图书馆竞争力的高低;结果显示直接影响读者用户的服务。我们要找准发展重点和主要矛盾,从整体视角上建设资源共享平台,发挥图书馆的职能,使服务水平得到提升。

参考文献

[1]梁孟华.图书馆知识信息服务综合评估研究[D].武汉:武汉大学, 2010. [2] 毛刚.图书馆用户需求生态服务系统研究[D].长春:吉林大学,2013. [3]刘雄洲,王菲.国外数据存管实施现状及其对国内高校图书馆的启 示[J].图书馆,2012(5):81-83. [4] 张兴旺.图书馆大数据体系构建的学术环境和战略思考[J].情报资料工作,2013(2):12-17. [5]侯茹.大英图书馆馆藏元数据战略报告研究[J].图书馆学研究, 2016(5):75-79. [6]刘晓英.大数据时代图书馆数字资源长期保存问题研究[J].图书馆,2016(7):90-96. [7] 仵淮林.大数据环境下数字图书馆面向用户的服务组织研究[D].武汉:华中师范大学,2015. [8]王浩.用大数据思维构建图书馆信息服务[J].情报探索,2016(10): 121-124,129. [9] 薛红,唐明元.论大数据时代图书馆电子资源建设模式[J].图书馆工作与研究,2016(10):52-56. [10] 许玲.大数据时代图书馆面临的挑战与对策思考[J].中共福建省委党校学报,2014(5):117-120. [11] 马晓亭.基于可信大数据的图书馆个性化服务平台构建[J].图书馆理论与实践,2015(1):85-88. (收稿日期:2017-01-03) (修回日期:2017-02-08;编辑:魏民)

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.