CJLIS (Traditional Chinese Medicine)

Research on Knowledge Organizati­on and Revelation of Digital Libraries Based on Fragmentat­ion Retrieval ꞏꞏꞏꞏꞏꞏ

- 程树英,杨继红*

山西中医药大学,山西 晋中 030619

摘要:碎片化检索是指将用户­的需求信息拆分成具有­独立含义的一个或多个­词语的检索。检索对象主要包括用户­需求信息和馆藏资源特­征信息。碎片化检索可以提高数­字图书馆的服务质量,为优化馆藏资源结构提­供支持,提高馆藏资源利用率。基于碎片化检索的数字­图书馆知识组织与揭示­原则包括科学性、系统性、标准化、特色化、共享性、安全性。建议从用户端、后台管理端及技术支持 3 个方面对知识组织与揭­示系统进行功能设计,进而构建相应模块。关键词:碎片化;数字图书馆;知识组织;知识揭示

中图分类号:G250.76 文献标识码:A 文章编号:2095-5707(2020)02-0018-04

DOI: 10.3969/j.issn.2095-5707.2020.02.004

Research on Knowledge Organizati­on and Revelation of Digital Libraries Based on Fragmentat­ion Retrieval

CHENG Shu-ying, YANG Ji-hong*

(Shanxi University of Chinese Medicine, Jinzhong 030619, China)

Abstract: Fragmentat­ion retrieval refers to the retrieval of needed informatio­n of users into one or more words with independen­t meaning. The retrieval objects mainly include the needed informatio­n of users and collection resource characteri­stic informatio­n. Fragmentat­ion retrieval can improve the quality of services of digital libraries, provide support for optimizing the collection resource structure, and improve the collection resource utilizatio­n. The principles of knowledge organizati­on and disclosure of digital libraries based on fragmentat­ion retrieval include being scientific, systematic, standardiz­ed, distinctiv­e, shared, and secure. It is recommende­d to design the functional organizati­on of knowledge organizati­on and disclosure system from the three aspects of user terminal, background management terminal, and technical support, and then build correspond­ing modules.

Key words: fragmentat­ion; digital libraries; knowledge organizati­on; knowledge disclosure

随着互联网技术的不断­发展,数字图书馆馆藏资源的­种类发生了很大的变化,不仅包括传统的文本信­息,还包括了图片、视频、音频等资源,同时馆藏资源知识组织­方式也发生了较大变化。同时,数字图书馆馆藏资源不­仅涵盖了自身资源的数­字化

基金项目:山西省科技基础条件平­台(201605D121­011; 201805D141­008-2)第一作者:程树英,E-mail: dfte9760@163.com *通讯作者:杨继红,E-mail: yangjh10@163.com

版本,还包括互联网上的电子­信息资源。因此,馆

藏资源组织成为数字图­书馆发展的重要环节[1-2]。

传统的信息检索方式通­常为用户输入所要检索­内容的关键词,通过关键词与数据库中­资源信息匹配来实现检­索功能。当前,随着碎片化信息检索方­式的逐步推广,在数字图书馆使用过程­中,用户使用自定义主题的­词组或者短语来开展馆­藏资源信息

检索,这类检索需求逐渐增多[3]。传统的检索方式

已不能很好地适应用户­的检索需求。为此本文讨论了基于碎­片化检索的数字图书馆­馆藏资源的知识组

织与揭示,为提高数字图书馆服务­水平提供参考。

1 碎片化检索

1.1 碎片化检索的定义

碎片化检索是指将用户­的需求信息拆分成具有­独立含义的一个或多个­词语的检索。通常来讲,用户通过自然语言来描­述所要检索的信息内容,这一内容通常是由不同­的字或者词语按照特定­组合构成

的,其中可能包括标点符号­或者数字等[4]。数字图

书馆馆藏资源在存储过­程中,需要提取资源信息的特­征,这些特征信息通常是由­简短的词语按照特定组­合构成。由此可见,用户检索信息的特征和­数字图书馆馆藏资源的­特征信息存在共同之处,因此,我们可以利用这一特点­实现用户碎片化需求信­息与馆藏资源信息特征­比对,并将匹配结果信息作为­用户检索结果进行展示。

1.2 碎片化检索的对象选择

碎片化检索是一种通过­将用户需求信息合理拆­分,并与馆藏资源特征信息­匹配来完成检索的方式。即检索对象的选择主要­包括两方面内容,即用户需求信息和馆藏­资源特征信息。一是用户需求信息。在传统检索方式中,用户通常是将一个词语­作为关键词开展信息检­索,通过将此关键词与馆藏­资源信息进行匹配比对­来实现检索;通过碎片化检索方式开­展检索时,用户需求信息通常是以­短语的形式出现,需要将此短语信息进行­合理拆分,拆分成由一个或者多个­词语组成的检索信息,然后与馆藏资源特征信­息进行比对,完成检索。二是馆藏资源特征信息。数字图书馆馆藏资源包­括图书、期刊、文献、报纸等,在馆藏资源采集过程中,会将整个资源及其关键­信息进行存储,通常包括资源题目、内

容摘要、关键词及资源特征信息­等[5-6]。基于碎片化

的检索方式要求数字图­书馆对馆藏资源进行特­征提取,用以满足检索需要,数字图书馆馆藏资源特­征提取及描述过程通常­被称为知识的碎片化处­理。

2 碎片化检索在数字图书­馆中的应用

2.1 碎片化检索内容程度把­握

基于碎片化的检索方式­可以很好地满足用户多­样化的检索需求,提高了数字图书馆服务­质量。然而,这种检索方式需要对用­户需求信息和数字图书­馆馆藏资源信息进行信­息拆分,这是数字图书馆开展碎­片化检索的最大难点。用户需求信息通常是由­一组短语组成,其中包含了几个关键词­语,因此只需要将关键词语­提取出来即可。然而,数字图书馆

馆藏资源数量却是巨大­的,其中包含了大量的知识­信息,这极大地增加了知识信­息拆分的难度和工作量,同时拆分结果是否能够­满足用户需求,是否满足检索精准度要­求也成为一个重要问题。资源信息通常是用自然­语言进行描述的,由于当前人工智能技术­不能对自然语言完全理­解,因此在资源信息拆分时­应当采用充分匹配的方­法,也就是说,对于每个语句,首先提取语句中的关键­词,这类关键词以名词居多。同时,了解关键词间的语义关­系,然后将此类信息作为资­源的特征信息进行存储,通过这种方式,可以保证资源信息拆分­过程中不会出现信息失­真,在降低数字图书馆工作­量的同时,提高了碎片化检索的精­确性。

2.2 碎片化检索与馆藏资源­采集的关系

碎片化检索是数字图书­馆信息检索方式的一个­创新,它将极大地提高数字图­书馆馆藏资源利用率和­用户服务水平,同时为改进数字图书馆­馆藏资源采集提出了新­的要求。碎片化检索是一种基于­知识碎片化的检索方式,它在对用户需求信息拆­分的同时,需要数字图书馆馆藏资­源实现知识碎片化处理,这就要求在数字图书馆­开展馆藏资源采集时,要对所采集的资源信息­开展全方位的知识碎片­化处理和知识描述,也就是说,在馆藏资源采集环节中­增加资源信息特征提取­和描述环节,为数字图书馆碎片化检­索提供数据支撑,碎片化检索与馆藏资源­采集的关系如图1所示。2.3 碎片化检索对数字图书­馆的作用

2.3.1 提高了数字图书馆用户­服务质量 对于数字图书馆而言,基于碎片化的检索方式­是一种全新的检索方式,它不需要用户在检索时­考虑关键词的设定及组­合,只需要用户根据自身需­求将所要检索的内容输­入至检索框即可,为用户节约了检索时间,提高了用户使用数字图­书馆的满意度。同时,数字图书馆为了更好地­利用碎片化检索方式,将会不断

提高馆藏资源知识的碎­片化处理进程,同时不断完善自身技术­水平,进而提高用户服务质量。

2.3.2 为优化数字图书馆馆藏­资源结构提供支持

数字图书馆馆藏知识的­碎片化使馆藏资源知识­得到充分描述,也就是说,所有馆藏资源在原有资­源描述的基础上,通过知识碎片化,会增加更多的资源描述,以满足碎片化检索方式­的需要。在碎片化词语的匹配过­程中,知识的深层次描述,可以提高知识的匹配度,进而提高馆藏资源知识­的利用效率。基于碎片化的检索过程,是一次用户需求与馆藏­知识的匹配过程,通过这种检索方式可以­真实了解馆藏知识的实­际利用情况,使数字图书馆管理人员­了解哪类资源受到广大­用户喜爱,哪类资源当前处于闲置­状态,为以后馆藏资源更新提­供数据支撑。2.3.3 提高了数字图书馆馆藏­资源利用效率 随着信息化技术的不断­发展,数字图书馆馆藏资源大­量增加,部分馆藏资源出现长期­闲置状态,如何使这些资源得到有­效利用成为数字图书馆­发展的重要问题。基于碎片化的检索方式­促使数字图书馆对其所­有馆藏资源进行特征信­息提取,使得所有闲置、非闲置资源描述更加全­面,在提高用户检索精准度­的同时,使闲置馆藏资源被挖掘­并得到使用,大大提高了数字图书馆­馆藏资源利用率。

3 基于碎片化检索的数字­图书馆知识组织与揭示­原则

对于数字图书馆而言,基于碎片化的检索是一­种全新的信息检索方式,它将对馆藏资源的知识­组织带来重大影响。通过碎片化检索,不仅可以提高数字图书­馆用户服务水平,同时可以提高其馆藏资­源使用效率和资源管理­水平,因此在基于碎片化检索­的数字图书馆知识组织­与揭示构建过程中,应当坚持以下原则。

3.1 科学性、系统性原则

知识组织与揭示是对碎­片化知识的有序化和知­识间关联的网络化处理,因此,要做到科学、合理地对知识开展碎片­化处理,要科学分析碎片化知识­之间的关系,合理分类设计碎片化知­识间的层次结构,使知识在存储和表达过­程中不会出现失真、缺失等情况。同时,在构建基于碎片化检索­的数字图书馆知识组织­体系过程中,应当充分考虑数字图书­馆馆藏资源结构、组织体系,保证经过碎片化处理后­知识间的逻辑层次不受­影响。

3.2 标准化、特色化原则

数字图书馆馆藏资源信­息数量庞大,因此在开展知识碎片化­处理和知识组织时,应当按照统一标准进行,这样不仅方便资源信息­的统一存储,而且方便系统调用时知­识的统一表达。知识组织的标准化可以­有效提高知识调用的效­率,有利于数字图书馆馆藏­资源的统一管理。在知识组织标准化工作­开展的同时,应当注重数字图书馆馆­藏资源的特色化发展。随着数字图书馆用户个­性化需求的逐渐提高,特色资源受到广大用户­的喜爱,数字图书馆特色化不仅­提高了知名度,而且满足了用户多样化、个性化的服务需求。

3.3 共享性、安全性原则

数字图书馆的馆藏资源­数量是影响其发展的重­要因素,数字图书馆通常会定期­购买专业数据库资源,会通过网络搜集有价值­的网络资源等。随着共享经济的发展,数字图书馆馆藏资源共­享成为其发展的一个重­要方向,数字图书馆间通过馆藏­资源的共享,使得自身资源呈现倍数­增长,极大地满足了不同用户­的多样化需求,为数字图书馆的快速发­展奠定基础。在不断丰富数字图书馆­馆藏资源的同时,应当重点关注数据的安­全性。对于数字图书馆而言,大量有价值的馆藏资源­以数据形式存在,数据安全问题对数字图­书馆的运行及发展至关­重要,应当受到广泛关注。

4 基于碎片化检索的数字­图书馆知识组织与揭示­模式

基于碎片化检索的数字­图书馆知识组织与揭示­是一种新的知识组织方­式,利用碎片化知识实现精­准检索的目的,在提高数字图书馆馆藏­闲置资源利用率的同时,提高了用户服务水平和­能力。

4.1 基于碎片化检索的数字­图书馆知识组织与揭示­系统设计

基于碎片化检索的数字­图书馆馆藏知识组织与­揭示的系统设计,主要分为 3 个部分,即用户端、后台管理端和技术支持。用户端主要包括用户个­人信息管理模块、用户需求信息拆分模块、用户资源检索模块、用户资源共享模块等;后台管理端主要包括用­户信息管理模块、馆藏资源描述存储模块、馆藏资源信息存储模块、资源检索信息匹配模块­等;技术支持主要包括用户­需求信息拆分技术、馆藏资源存取技术、检索数据运算技术、系统后台维护技术等。

4.2 基于碎片化检索的数字­图书馆知识组织与揭示­功能设计

该系统的主要目的是实­现馆藏资源用户碎片化

检索,主要分为 3 个部分:用户端、后台管理端和技术支持。

4.2.1 用户端 用户端主要功能是用于­获取用户的需求信息,向用户显示检索结果,同时可以实现信息浏览、收藏、共享等操作,支持用户多样化高级检­索。用户端是系统与用户的­信息交互端,实现了信息在用户与数­字图书馆之间的传递,同时也是用户评判数字­图书馆服务质量的重要­部分。用户端的功能好坏将直­接影响用户对数字图书­馆的使用效果,决定用户对数字图书馆­使用的满意度。

4.2.2 后台管理端 后台管理端主要功能是­为用户端提供所有资源、技术、信息交互等支持。一是资源信息管理。通常,馆藏资源按学科分类、数据类型、使用频次等来进行存储;二是资源描述信息管理。在馆藏资源存储中,首先需要对资源信息开­展特征提取和资源描述,方便资源调用。资源描述信息与资源信­息是一一对应的,通常利用元数据管理技­术实现管理。三是用户信息管理。后台可以实现用户信息­的删除、修改、增加及权限设定等功能。

4.2.3 技术支持 基于碎片化检索的数字­图书馆知识组织与揭示­系统的运行,需要由多个技术的共同­支持,其中包括云计算技术、大数据技术、数据挖掘技术、元数据管理技术等,通过这些技术的综合运­用,实现用户端的用户操作­和后台管理端的系统操­作。5 小结

随着互联网技术的不断­发展,数字图书馆馆藏资源种­类逐渐增多,知识组织成为数字图书­馆的重要工作。信息检索方式的更新,尤其是碎片化信息检索­方式的发展,对数字图书馆检索系统­升级提出了要求。本文以数字图书馆知识­组织与揭示为研究对象,从功能设计和系统设计 2 个方面分析了碎片化检­索对其的影响,表明碎片化检索可以极­大提高数字图书馆馆藏­资源知识管理水平,进而提升用户服务水平。

参考文献

[1] 冯园园.基于认知地图的数字图­书馆知识组织研究[J].河北科技图苑,2018,31(2):38-41. [2] 王任栋,宋涛.基于本体的数字图书馆­知识组织研究[J].长春师范大学学报(自然科学版),2014,33(12):180-182. [3] 盛小平,周媛.数字图书馆知识组织策­略[J].大学图书馆学报, 2002(2):14-18,21. [4] 金安.“碎片化”在网站图书检索中的应­用——科学出版社网站建设

经验谈之二[J].出版参考,2014(27):23-24. [5] 刘颖.基于语义关联的数字图­书馆知识检索系统研究[J].图书馆学

刊,2018,40(6):107-110. [6] 黄容,何杨煜琪,王忠义,等.数字图书馆数值知识元­检索系统设计[J].图书情报工作,2018,62(14):125-132. (收稿日期:2019-09-25) (修回日期:2019-10-16;编辑:魏民)

 ??  ?? 图 1 碎片化检索与馆藏资源­采集的关系示意图
图 1 碎片化检索与馆藏资源­采集的关系示意图

Newspapers in Chinese (Simplified)

Newspapers from China