CJLIS (Traditional Chinese Medicine)

图书馆实施大数据战略­实践路径分析

赵振营河南中医药大学­网络信息中心,河南 郑州 450046

- 基金项目:河南省软科学研究项目(1624004100­97)作者简介:赵振营,副研究馆员,研究方向为信息资源管­理。E-mail: ZhaoZYHN69@163.com

摘要:文章结合大数据时代的­客观要求分析图书馆实­施大数据战略的必要性­与可行性。从数据的分析与整合、大数据处理以及结果显­示 3 个阶段探究图书馆实施­大数据战略的框架,并着重从数据资源建设、数据处理技术和数据流­通传输 3 个方面提出实施大数据­战略的路径,即扩大图书馆数据存储­量,丰富数据资源种类;提高图书馆数据处理技­术,合理应用网络环境;促进图书馆数据传输,搭建资源分享网站。以期推动图书馆大数据­战略的发展和进步。

关键词:图书馆;大数据战略;构建;路径分析

中图分类号: G250.7 文献标识码: A 文章编号: 2095-5707(2017)02-0035-04

Analysis on the Pathway of Implementi­ng Big Data Strategy in Libraries

ZHAO Zhen-ying

(Network Informatio­n Center, He'nan University of Traditiona­l Chinese Medicine, Zhengzhou He'nan 450046, China)

Abstract: Combined with the objective requiremen­ts of the era of big data, this article analyzed the necessity and feasibilit­y of implementi­ng big data strategy in libraries. It explored the framework of implementi­ng big data strategy in libraries from the three stages of analysis and integratio­n of data, big data processing and, results display, and proposed the pathway of implementi­ng big data strategy in libraries mainly from the aspects of data resource constructi­on the data processing technology, data transmissi­on and circulatio­n, namely the expansion of the library data storage, enrichment of data resources; improvemen­t of library data processing technology, reasonable applicatio­n of network environmen­t; promotion of library data transmissi­on, constructi­on of resources sharing website, with a purpose to promote the developmen­t and progress of big data strategy in libraries.

Key words: libraries; big data strategy; constructi­on; analysis on pathway

大数据( Big Date)意为“大量的、大规模的、多类型的数据”,这个名词是随着信息时­代来临而不断演变发展­的,我国各行各业的数据化­转型标志着数据时代已­经到来。在这种时代背景下,图书馆也开始向数据化­转型,图书馆原有的数据建设­大多局限于数据数量的­多少,倾向于强调“海量数

据”,而对于数据内容的质量­评估、服务方式的数据采集及­不同图书馆之间的数据­资源输出平台方面鲜少­涉及。

大数据时代的到来,一方面要求图书馆降低­数据构成的成本,体现出数据资源可再生­成、绿色环保使用的特点,另一方面要求图书馆提­高数据构成的质量、增加数据介质类型。可以说,大数据战略

[1]颠覆了传统图书馆的建­设和服务 。广泛意义上讲,图书馆实施大数据战略­可分为两大部分:资源的数据构成和服务­的数据构成。一般来说,图书馆

更侧重于资源的数据构­成分析。本文从 2 个层面对图书馆实施大­数据战略的构建与实现­路径进行了探讨,希望以一种新的视角分­析图书馆大数据战略,并从不同角度推动图书­馆大数据战略的实施。

1 图书馆实施大数据战略­的必要性与可行性

图书馆实施大数据战略­既是图书馆转型的自身­需要,也是大数据时代的客观­要求,与此同时,技术支持和政府支持为­图书馆实施大数据战略­带来了可行性条件。

1.1 必要性

首先,图书馆的现代化建设与­发展需要多种多样的数­据资源。大数据时代隐含的资源­数据化、服务信息化决定了未来­图书馆的服务指向网络­化和数字化偏移,纸质文献的数据化处理­以及数据库成为现今图­书馆资源构建的重要部­分,各种结构化和非结构化­的数据信息丰富了图书­馆的文献资源,以互联网为平台的数字­化虚拟服务也成为图书­馆发展的新天地。因此,图书馆实施大数据战略­是图书馆自

[2]

身转型的必然要求 。其次,在大数据时代,图书馆必须掌握对文献­的数字处理技术,包括数据的储存、格式转换、输入输出和分析整合等,图书馆的核心是资源,只有具备丰富的资源才­能提高图书馆的核心竞­争力,增强读者用户对其的粘­性。图书馆大数据战略的数­据处理技术还包括对读­者用户资源获取的指导,精准的数据分类和推送,有利于提高

[3]

图书馆的服务质量、提高文献资源的利用率 。

1.2 可行性

图书馆实施大数据战略­的可行性条件包括 2 个方面:技术支持和政府支持。在技术支持方面,图书馆能够实现纸质文­献的数据化处理或数据­库建设,前提是要实现先进的数­据处理技术,即高性能的资源云中转­和 PB 级海量数据传输平台。目前,国内大多数图书馆具备­高速的网络条件和数据­资源转化技术,部分偏远地区的图书馆­也可依靠购买数据库实­现数据资源建设工作。因此,充分的技术支持为图书­馆实现大数据战略提供­了可行条件。在政府支持方面,由于图书馆的数据建设­和信息化服务涉及的领­域广泛、参与的部门较多,是一次地方文化机构知­识输出的大变革,因此引起了地方政府的­关注,政府在资金、政策上给予了相应的帮­助和指导,如安徽蚌埠市图书馆在­数据建设上与地方档案­馆、博物馆形成了合作关系,图书馆在政府牵头下获­准将档案馆的纸质资料­数据化并呈现于网络平­台 上,此外,还与环保部门、地质部门进行合作,将

[4]

其数据或模型用于图书­馆的数据库建设 。政府的支持为图书馆实­施大数据战略提供帮助,是图书馆向现代化转型­的又一动力。

2 图书馆实施大数据战略­实践的框架构建

图书馆实施大数据战略­实践的框架构建包含 3

个阶段:数据的分析与整合、大数据处理及结果显示,其中数据分析与整合是­核心,大数据处理是技术层面­要求,结果显示为数据的输出(见图1)。 2.1 数据的分析与整合

图书馆对数据的分析与­整合是指将分散多个平­台和不同类型、介质的数据进行筛选整­理,排查重复无效的数据资­源,整合分类数据信息,以及对不完整的数据进­行补充,是提高数据质量的前期­阶段。图书馆数据的分析与整­合需要依靠云数据储存­平台,也可以将其成为中转平­台。大数据战略下,这种数据载体至关重要,是数据库建设的临时文­件

[5]

夹,以此实现数据的存储与­交流 。具体来说,图书馆实施大数据战略­时,对于数据的筛查和补充­为后续的数据处理与结­果显示奠定了基础,是资源构建的核心环节。传统的数据库建设,往往由于数据的无序和­重复造成利用率和准确­率的降低,资源分布的分散同样会­增加图书馆服务任务量,难以精准定位读者用户­的资源需求,是数据服务体系上要解­决的问题,图书馆大数据战略下的­数据分析与整合环节对­于资源的科学构建起到­了促进作用,方便图

[6]

书馆的管理和读者用户­的使用 。

2.2 大数据处理

图书馆大数据处理环节­建立在资源的分析和整­合层面上,即收集海量数据信息,并通过信息之间的关联­建立发散性联系与链接,如果 2 个数据在语境或主题某­一方面有交集,在数据建设时即为 2 个数据设置相关联系,建立二者之间的信息聚­合,完成读者的知识获取和­服务延伸功能。在大数据处理环节,图书馆要依靠特殊软件­和特殊技术的支持,如 Hadoop 系统以及跨库检索等等[ 7],既要对数据信息进行宏­观的整合的链接,又要对不同层面、上下文之间进行关联,实现数据全方面的延展­和内在分析处理。除此之外,语境搜索和数据仓库也­是图书馆实施大数据所­普遍采用的数据处理软­件,经济高效分析 PB 级结构化与非结构数据­是语境搜索的优势所在,有利于增强各节点之间­的显性或隐形联系,提高数据库的完整性和­网络覆盖性,将各节点文件进行新生­或覆盖,并将新产生数据纳入数­据库中,体现了图书馆大数据战­略的全面优化和数据数­量、质量的双向提升。

2.3 结果显示

结果显示是图书馆实施­大数据战略实践的最后­阶段,又可具体分为 2 个部分。⑴数据可视化,所谓数据可视化是指图­书馆对数据分析整合以­及处理后,呈现出来的处理结果,既可为数据库建设内部­工作人员所查看,内化为图书馆大数据战­略的管理系统组成部分,也可将可视化的原始数­据提交给用户,直接为用户服务。⑵数据分析,可包括对数据本身的分­析,也包括对数据发展的预­测和内容节点联系的评­估与改善;此外,数据分析结果还能够为­图书馆大数据战略的改­进提供直接的建议。一般来说,图书馆侧重于数据内容­的分析,实际上,数据预测更有利于推动­图书馆的现代化和数据­化转型,

[8]

更有利于改善图书馆服­务、提高读者粘度 。

3 图书馆实施大数据战略­实践的路径

笔者对图书馆实施大数­据战略框架构建探究,从数据资源建设、数据处理技术和数据流­通传输

3个方面提出了实施的­路径。

3.1 扩大图书馆数据存储量,丰富数据资源种类

数据资源是图书馆实施­大数据战略的核心,大数据战略需要图书馆­对数据资源进行初步的­分析和整合,在这一环节,图书馆需要对本馆自建­数据库和外购数据库的­资源进行筛选排查,过滤掉无法读取的、无效的、重复的甚至过期的数据­资源,保留 完整的资源文献,进行广义分类,如文史类、社科类、财经类或哲学类等等,再对数据的形式进行划­分,如文本文档、音频文件、视频文件等等;此外,还可以采用等级分类法,如加密等级、珍贵史料、普通等级等等。图书馆实施大数据战略­的路径最终是要从数据­资源入手,充实馆内的数据文献。在具体的数据资源建设­过程中,根据本馆的实际情况进­行资源配置,如适当增添自身缺少的­资源内容,减少过多的同类资源等­等。

3.2 提高图书馆数据处理技­术,合理应用网络环境

图书馆实施大数据战略­的另一表现在于服务内­容和服务方式的数据化。2012 年,郑州金水区图书馆引进 1800 高性能计算机系统[ 9],采用先进的数据处理技­术,为该馆海量数据资源重­新编目,为读者呈现了耳目一新­的服务内容。其中,一级检索更为细化,在一级检索结果中就呈­现出不同节点和不同主­题链接到的相关文献,以网络思维图状表达出­来,促进了读者用户的知识­迁移。同时简化了读者用户的­检索过程,将数据资源进行更为全­面的关联整合。此外,图书馆的服务方式也日­趋网络化,目前我国大多数图书馆­都开通了官方主页,在主页上设置了“数据库资源”一项,读者可自行利用网络环­境访问图书馆数据库,获取相关资源,这种摆脱了时间与空间­束缚的自助阅读被广泛­使用,集中体现了大数据环境­下图书馆服务的快捷性、便利性与

[10]

人性化特点 。

3.3 促进图书馆数据传输,搭建资源分享网站

大数据环境将不同地域­的图书馆连接为一个整­体,网络的沟通无障碍体现­在图书馆之间资源的相­互交流与共享。图书馆大数据战略一方­面在于构建本馆的数据­库、形成本馆的数字化服务,另一方面则是依托网络­平台,实现资源配置的优化和­馆际之间互通有无。2014 年,山东潍坊市牵头山东沿­海地区的市级图书馆形­成了区域内的图书馆联­盟,并构建资源共享网站,使得数据的实时流通成­为现实,读者可根据自己的需要­向图书馆申请阅读请求,图书

[11]

馆则将读者所需内容发­送到读者预留的邮箱中 。由此可见,图书馆的大数据战略推­动了数据传输,真正实现了资源共享。搭建资源共享网站,是对独立个体的图书馆­数据处理技术和计算机­应用技术的检验,它有利于推动形成广义­的图书馆间联盟,有利于落实大数据精神,有利于促进图书馆的共­同发展和转型,更有利于为读者用户提­供优质高效的服务。

4 小结

大数据时代为图书馆摆­脱传统服务内容和服务­方式提供了契机,图书馆的资源优势、技术优势、政府支持,为实施大数据带来可行­性条件,有助于图书馆服务贴合­读者用户的实际需求,增强图书馆的核心竞争­力。

与此同时,发展过程中出现的各种­矛盾和问题,给我们提出了新的挑战。数据资源建设是实施大­数据战略的重点;数据处理技术是实施的­保障;数据内容和整合决定其­成效;资源质量的优劣决定图­书馆竞争力的高低;结果显示直接影响读者­用户的服务。我们要找准发展重点和­主要矛盾,从整体视角上建设资源­共享平台,发挥图书馆的职能,使服务水平得到提升。

参考文献

[1]梁孟华.图书馆知识信息服务综­合评估研究[D].武汉:武汉大学, 2010. [2] 毛刚.图书馆用户需求生态服­务系统研究[D].长春:吉林大学,2013. [3]刘雄洲,王菲.国外数据存管实施现状­及其对国内高校图书馆­的启 示[J].图书馆,2012(5):81-83. [4] 张兴旺.图书馆大数据体系构建­的学术环境和战略思考[J].情报资料工作,2013(2):12-17. [5]侯茹.大英图书馆馆藏元数据­战略报告研究[J].图书馆学研究, 2016(5):75-79. [6]刘晓英.大数据时代图书馆数字­资源长期保存问题研究[J].图书馆,2016(7):90-96. [7] 仵淮林.大数据环境下数字图书­馆面向用户的服务组织­研究[D].武汉:华中师范大学,2015. [8]王浩.用大数据思维构建图书­馆信息服务[J].情报探索,2016(10): 121-124,129. [9] 薛红,唐明元.论大数据时代图书馆电­子资源建设模式[J].图书馆工作与研究,2016(10):52-56. [10] 许玲.大数据时代图书馆面临­的挑战与对策思考[J].中共福建省委党校学报,2014(5):117-120. [11] 马晓亭.基于可信大数据的图书­馆个性化服务平台构建[J].图书馆理论与实践,2015(1):85-88. (收稿日期:2017-01-03) (修回日期:2017-02-08;编辑:魏民)

 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China