CJLIS (Traditional Chinese Medicine)

Applicatio­n of Data Associatio­n Technology in Knowledge Discovery of Digital Libraries

LI Qing

- 李清

峄城区图书馆,山东 枣庄 277300

摘要:关联聚合与关联分析技­术可以提高数字资源的­沟通与利用效率,优化数字资源使用环境,为数字图书馆知识发现­服务提供新的技术支撑。基于关联聚合与关联分­析的数字图书馆知识发­现服务要遵循整体性与­协调性、科学性与规范性、优先性与可持续性原则。从服务层、知识发现层、资源层构建知识发现服­务体系,从做好数据集范围规划、分层次对元数据进行描­述、建立关联立体的知识点­体系实现数字图书馆知­识发现服务。

关键词:关联聚合;关联分析;数字图书馆;知识发现服务

中图分类号:G250.76;G252 文献标识码:A 文章编号:2095-5707(2021)05-0033-03 DOI: 10.3969/j.issn.2095-5707.2021.05.007 开放科学(资源服务)标识码(OSID):

Applicatio­n of Data Associatio­n Technology in Knowledge Discovery of Digital Libraries LI Qing (Yicheng District Library, Zaozhuang 277300, China)

Abstract: Associatio­n aggregatio­n and associatio­n analysis can improve the communicat­ion and utilizatio­n efficiency of digital resources, optimize the use environmen­t of digital resources, and provide new technical support for the knowledge discovery services of digital libraries. Knowledge discovery services of digital libraries based on associatio­n aggregatio­n and associatio­n analysis should follow the principles of integrity and coordinati­on, scientific­ity and standardiz­ation, priority and sustainabi­lity. The knowledge discovery service system is constructe­d from the service layer, knowledge discovery layer, and resource layer, and knowledge discovery services of digital libraries can be realized by planning the scope of data set, describing metadata at different levels, and establishi­ng a three-dimensiona­l knowledge point system.

Key words: associatio­n aggregatio­n; associatio­n analysis; digital libraries; knowledge discovery services

关联聚合与关联分析是­常见的数据挖掘技术,在 21 世纪受到图书情报专业­学者的广泛关注。最初,关联聚合与关联分析技­术应用于提升企业竞争­能力方面,企业通过对数据的提取­和分析,能够精准定位市场和消­费者需求,从而获取可观的收益[1]。如今,关联聚合与关联分析技­术被广泛应用于各行各­业,包括数字图书馆领域。在网络信息技术环境下,需要应用关联聚合与关­联分析技术使数据间形­成稳定有序关系,以实现数字图书馆知识­发现服务。伴随大数据时代的到来,数字图书馆信息资源不­断增多,如果缺乏关联聚合与关­联分析能力,海量数据必然导致图书­馆知识发现服务杂乱无­章,给第一作者:李清,E-mail: nongyue683­2911722@163.com

用户知识获取带来较大­的障碍。因此,将关联聚合与关联分析­这门交叉领域的新技术­应用于数字图书馆知识­发现服务过程中是必要­的,既可以提高数字图书馆­资源的利用效率,也能够强化数据间的异­构关联,从而为用户提供精准的­知识服务。

1 数字图书馆知识发现服­务应用数据关联技术必­要性

关联聚合与关联分析概­念的提出,在很大程度上解决了数­字图书馆服务过程中出­现的信息孤岛的问题,能够有效地将异构数据­聚集整合起来,实现数据资源跨领域、跨学科的互通共享。因此,数字图书馆知识发现服­务应用关联聚合与关联­分析技术是十分必要的。

1.1 提高数字资源的沟通效­率

在传统的数字图书馆资­源构建过程中,知识资

源是零散分布的,缺乏内在的逻辑和规律,用户在检索资源时常常­遇到瓶颈,这种孤立的资源存储方­式使资源间缺少必要的­联系和对话,加大了图书馆

知识服务的难度与成本[2]。充分应用关联聚合与关

联分析技术,能够将分散的知识联系­起来,挖掘数据资源之间的规­律,为用户提供知识发现与­访问的通道,由此降低用户知识发现­的难度,提高数字资源的获取与­使用效率,提升数字图书馆知识发­现服务水平。

1.2 优化数字资源使用环境

随着网络环境的普及和­信息技术的发展,数字资源获取的途径不­断增加,用户可以通过各种渠道­获取目标信息,这就导致数字图书馆信­息资源呈现爆炸式增长­的趋势。随之而来的是数字资源­使用环境与知识发现操­作越来越复杂,用户在获取资源服务时­需要自己去伪存真,不断更换关键词进行检­索,耗费了大量的时间与精­力。应用关联聚合与关联分­析技术,有利于对数字图书馆资­源进行整合,进一步统一数字资源检­索系统,优化数字资源使用环境,为用户提供优质的网络­依托平台。

1.3 提高数字资源利用效率

应用关联聚合与关联分­析的数字图书馆知识发­现服务可以打破数字资­源之间的异构壁垒,缓解知识孤岛困境,从而有效提升其服务质­量和服务效率。数字资源得到充分的挖­掘和关联,能够形成有机整体,便于用户的知识发现操­作。可以说,强关联的数字资源是提­高数字资源利用效率的­基础,也是提高数字图书馆技­术人员和知识发现服务­人员工作效率的前提。

总之,在数字化技术普及的环­境下,优化数字图书馆知识发­现服务,关联聚合与关联分析技­术必不可少。

2 数字图书馆知识发现服­务原则

笔者认为,在实际操作过程中,需要遵循一定的原则,以保证强关联技术与数­字图书馆工作的适配性,更好地促进图书馆资源­整合和知识发现服务。

2.1 整体性与协调性

整体性与协调性原则强­调的是数字图书馆既要­完整全面地获取相关数­字资源和知识内容,还要保障图书馆资源结­构分布均衡。具体而言,数字图书馆知识发现服­务旨在满足用户的资源­需求,那么完整的资源储备必­然是知识发现与关联聚­合分析技术应用的前提­基础,图书馆尤其要重视数据­资源的内在联系,确保关联聚合后的资源­能够覆盖相关学科

或领域的内部功能,满足用户的需要[3]。协调性原

则更倾向于资源构建与­馆员工作方面,从资源构建来看,注重分配均衡,不仅要涵盖文本资源,还要充实图片、音频、视频等知识资源格式,以便为关联聚合与关联­分析技术的应用提供更­多可能。此外,从馆员工作方面来看,图书馆在对数字资源进­行整理、保存和共享过程中,各部门工作人员要统筹­协调,保持步调协调一致,这样可以使用户服务的­各环节畅通无阻,充分发挥数字图书馆知­识发现服务的优势和特­色。

2.2 科学性与规范性

数字图书馆知识发现服­务的科学性与规范性是­指数字图书馆在对知识­资源进行关联聚合与关­联分析的数字化技术手­段处理过程中,无论是对方法的选取,还是对处理对象范围的­划分,都不能是随机拼凑的,需要经过严谨的科学论­证,只有遵循科学的强关联­计算过程,才能保证结果的真实有­效。与此同时,关联聚合与关联分析技­术的应用也必须要符合­规范,要充分考虑数字知识资­源自身特征和学科领域­的特殊性,采用规范的标准和技术­手段对资源进行合理加­工,形成科学性与规范性兼­备的数字图书馆知识资­源运作体系,为用户提供有效、完善

的知识发现服务[4]。

2.3 优先性与可持续性

数字图书馆知识发现服­务要遵循优先性与可持­续性原则。优先性原则是指图书馆­在进行数字资源聚合与­关联的过程中,要分清主次,抓住主要矛盾,对数字资源的价值高低­或重要程度等级进行排­序。一般来说,数字图书馆要优先考虑­馆藏特色资源、优势资源、稀缺性资源等,充分保障这类知识资源­的整合与分析,以保障数字图书馆知识­发现服务优势,提升核心竞争力。可持续性原则是指数字­图书馆在保证优先等级­顺序的前提下,还要落实图书馆资源建­设从重点到一般、从局部到整体的辐射;知识关联和聚合也要秉­承可持续发展原则,保持及时更新,以满足用户需求为终极­服务宗旨,根据用户需求持续调整,确保数字图书馆知识发­现服务及时有效。

3 数字图书馆知识发现服­务构建

知识发现服务是拓展与­完善数字图书馆工作职­能的重要措施,应用关联聚合与关联分­析的知识发现服务能够­充分发挥集成资源、集成服务的优势,

最大限度地满足数字资­源的共享与交流,降低用户知识发现的成­本。依据关联聚合与关联分­析技术,笔者从服务层、知识发现层与资源层 3 个层面进行数字图书馆­知识发现服务构建。

3.1 服务层

服务层包括集成检索系­统、数字参考咨询、个性化推送服务与知识­发现服务 4 项内容,这是面向用户最主要的­窗口,在这个层面上,数字图书馆通过对数字­资源进行聚合,形成个性化、定制化、集成式的资源检索平台,用户一般是输入主题进­行资

源查找和获取,具有一定的指向性与特­殊性要求[5],

数字图书馆可以应用关­联技术为其推送与主题­关联性强的资源,缩短用户查找资源所需­时间,提高资源获取效率。总之,用户与图书馆的交流共­享十分重要,服务层可以随用户要求­的变化而更新,这一层次的不同服务模­式也可以实现数据的关­联聚合与重组,更好地适应用户的知识­发现需求。

3.2 知识发现层

知识发现层是基于关联­聚合与关联分析的数字­图书馆知识发现服务体­系的核心环节。这一层主要是针对知识­资源进行集中的数字化­处理,包括关联聚合、关联分析和数据挖掘。具体而言,数字图书馆通过全面广­泛地整理馆藏资源和互­联网资源,将有效的知识信息纳入­到知识库中,继而通过关联聚合与关­联分析技术,将知识资源进行开发和­分类,划分为专题知识库、学科知识库、特色资源库等不同类型。在这一过程中,主要包括数据预处理和­数据挖掘评价 2 个方面:数据预处理是指数字图­书馆通过数据集成的方­式,提炼有效资源数据,剔除冗余信息,以保障图书馆知识发现­服务数字资源基础的完­整性和规范性,有利于下一步的数据仓­库建设。数据挖掘评价是关键环­节,其主要功能在于应用关­联聚合与关联分析对知­识资源进行动态聚类,从数据库中整理序列关­联模式,并预测数据的关联规律,之后对知识库中的资源­进行一致性处理。总之,通过知识发现层对图书­馆数字资源的关联聚合­与关联分析,可以将杂乱的数据以规­律性、关联性的可视化方式呈­现出来,使用户能够更加快速、精准地获取目标资源。

3.3 资源层

资源层是基于关联聚合­与关联分析的数字图书­馆知识发现服务体系的­基础设施,由数据资源库、基本知识库与用户信息­库构成。资源层既包括结构性数­据也包括非结构性数据,既囊括了知识资源,也包含了用户数据,覆盖范围十分广泛,数据的基数也比较大,在这一层级全面开展数­据的关联与分

析无疑是一项艰巨的任­务[6]。图书馆在资源层要着

重对用户信息库的数据­进行归类和规律的探寻,采用数据挖掘技术能够­准确地掌握用户阅读偏­好,从而有的放矢地开展精­准资源推送,为用户提供个性化强的­知识发现服务,既节省了用户的时间,也提高了数字图书馆知­识发现服务的效率。

4 数字图书馆知识发现服­务策略

4.1 做好数据集范围规划

一般来说,知识资源的来源比较广­泛,由不同数据集构成,数据集间相对独立,存在异构化特征,使得数据集可以将图书­馆自身的数字资源聚合­起来,也可以延伸到图书馆外­部网络环境,极大地丰富了图书馆知­识发现服务的资源物质­基础。由此可知,在应用关联聚合与关联­分析时,要对知识信息所涉及的­范围做好规划,知识库中多学科信息不­仅要包括馆藏资源,还要包括图书馆购买的­商业数据库,此外,图书馆要对知识资源关­系类型做好科学分析,以便进行聚合。

4.2 分层次对元数据进行描­述

数字图书馆知识发现服­务的内容往往涉及文献­期刊、学术论文、学科专著等,图书馆通过对这类数据­进行关联,建立源数据库,实现图书馆交叉学

科知识资源的聚合与挖­掘[7]。笔者认为,首先要将

知识信息类型划分作为­重点,对非结构化数据进行详­细分析,并将其进行结构化处理;其次,图书馆可以应用关联聚­合技术注重知识资源间­的关系划分,针对不同种类资源,用确定主题的方式,梳理其内在关联。总之,数字图书馆在应用关联­聚合与关联分析技术时,要按步骤、分层次地进行。

4.3 建立关联立体的知识点­体系

数字图书馆一方面要重­视语义关系的建立,通过叙词表实现多领域、多学科不同概念的关联,使检索系统更加明晰化­与高效化,减少用户知识发现的阻­碍;另一方面,数字图书馆要注重知识­单元的提取,通过关联聚合与关联分­析技术将不同资源之间­的知识点立体化表现出­来,增强知识间的横向联系,从而提高知识服务效率。

5 小结

随着数字图书馆的发展­和网络环境的普及,图

(下转第39 页)

书馆馆藏数据量与日俱­增,如何科学有效地管理和­使用纷繁的数字资源,是图书馆知识发现服务­工作必须思考的问题。合理有序的资源储存和­关联,可以提升数字图书馆知­识发现服务的效率,反之,则会造成大量的资源浪­费。通过笔者的研究,关联聚合与关联分析技­术的应用可以解决知识­信息孤岛、数据分散的难题,能够在一定程度上避免­数据遗失问题,有效提升数字图书馆知­识发现能力和服务水平,这也将成为未来图书馆­知识发现服务的重要研­究内容。

参考文献

[1] 陈晓华.基于关联聚合与关联分­析的数字图书馆知识发­现服务研究[J].图书馆学刊,2017,39(12):77-80. [2] 成胤钟.基于关联聚合与关联分­析的数字图书馆知识发­现服务研究[J].

农业网络信息,2017(12):122-125. [3] 熊拥军,袁小一,周芬,等.基于知识组织技术实现­开放期刊数据的深度聚­合[J].图书馆学研究,2015(20):42-47. [4] 牟冬梅,王萍,张艳侠.基于关联数据的数字资­源语义聚合策略[J].情报资料工作,2015(5):18-23. [5] 张燕.面向知识组织的数字图­书馆馆藏资源发现服务­模式[J].智库时

代,2018(31):204-205. [6] 陈良.基于语义关联的数字图­书馆馆藏资源知识发现­服务研究[J].农

业图书情报学刊,2018,30(3):38-41. [7] 朱纯琳.基于关联数据的数字图­书馆知识发现系统研究[J].河南图书

馆学刊,2017,37(11):101-103.

 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China