CJLIS (Traditional Chinese Medicine)
数字人文时代图书馆古籍文献资源的数字化长期保存机制探讨
陈诚
上海市松江区图书馆,上海 201699摘要:数字人文改变了现代科研面貌,为古籍文献的深层次开发提供了新思路。文章从古籍文献保存的客观要求、深层次开发古籍文献的需求及传承中华优秀传统文化的需求等方面,介绍了数字人文时代古籍文献数字化建设的意义;分析了图书馆常用的文本挖掘、地理信息系统及知识发现等古籍文献资源数字化建设的常用技术;研究了图书馆古籍文献专题数据库的构建技术及规范;着重从建立统一的古籍长期保存标准、人才培养机制、数字化共享等方面,提出建立图书馆古籍文献长期保存机制的策略。关键词:数字人文;古籍文献;数字化;保存;图书馆
DOI: 10.3969/j.issn.2095-5707.2019.03.002
中图分类号: G255.1;G258.2 文献标识码: A 文章编号: 2095-5707(2019)03-0006-04
古籍记录着我国各民族的文化历史与发展状况,具有科学研究价值与文化传承价值,是档案文献遗产的重要部分。古籍文献多为纸质资料,易受到自然与人为因素的影响,增加了存储利用的难度。作为文献存储与流通机构,无论何种类型的图书馆,均有不同规模的古籍收藏。古籍存储对环境、技术等要求较高,很多图书馆由于修复技术落
后、设施不完善等问题,难以保障古籍文献管理的
[1]
有效性 。如今数字化技术的高速发展,深刻影响着现代社会的科研面貌,给传统人文科研带来新的理论与方法。这种改变冲击着传统人文的研究维度,促进了人文科学与数字化技术的融合,也标志着数字人文时代的来临。数字人文强调依托先进信息技术,开展数字化资源整合与可视化服务,实现知识挖掘,提升数据资源的利用价值。将数字人文理念引入古籍保护领域,加快古籍文献数字化建
设,可以为古籍文献的深度开发创造条件,也有助于图书馆古籍文献的长期保存与利用。
1 数字人文时代加强古籍文献资源数字化建设的意义
古籍文献资源是宝贵的文化遗产,强化图书馆古籍数字化建设,是顺应数字人文时代趋势的要求,也是深入挖掘古籍科研价值、促进优秀文化传承的需求。
1.1 古籍文献保存的客观要求
古籍文献多为纸质资料,易出现虫蛀、潮湿、纸张老化等,对物理保存条件要求高。如何对这些资源进行长期保存,是图书馆等文献存储机构需要解决的问题。一些图书馆为了保护好珍贵文献,采用了多种文献修复与管理方式,如通过文本影印的方式复制古籍善本,避免纸质原件丢失;或通过制作微缩光盘减少存储空间,延长古籍存储周期。然而,由于古籍文献种类繁多,来源复杂,需要投入大量资金与人力,采用上述方法并不能缓解古籍保护的压力,也难以满足用户对古籍利用的需求。而数字化技术的引入,为古籍文献数字化创造了条件,
[2]
有助于提高古籍文献存储、检索和利用效率 。
1.2 深层次开发古籍文献的需求
目前很多图书馆在古籍文献保存方面,由于受设施设备落后、人员不足等限制,或者由于重视度不够,导致馆藏古籍流通率不高,变成鲜有人问津的“古董”。从收录范围来看,部分图书馆收藏的古籍文献不够系统完整;从服务内容来看,多以提供借阅服务为主,缺乏对古籍资源的深层次开发,难以真正体现古籍的作用。图书馆必须改变“重藏轻用”的局面,将古籍文献更好地利用起来,保障古籍文献的可持续性,为科研、教学等提供多元化的服务。尤其是借助数字化技术,改变图书馆古籍文献的存储状态,不仅可以方便用户借阅与传播,也可以促进隐性知识显性化,进一步提升古籍的社会利用价值。
1.3 传承中华优秀传统文化的需求
古籍属于不可再生资源,是我国悠久历史文化的传播载体,蕴藏着前人智慧的结晶。古籍文献有极高的存储价值,一旦毁损或消失,也意味着宝贵文化遗产的消亡。图书馆对典藏的古籍文献进行数字化处理,是一种替代性的再开发方式,既能够代替纸质文本,也可以让孤本不孤,让更多的人接触到经典。尤其是在我国大力倡导弘扬传统文化的背景下,图书馆结合用户阅读需求,依托数字化技术促进古籍文献传播,本身就是传承优秀文化的必要方式,也是图书馆在社会教育方面必须承担的使命。因此,图书馆要保障古籍文献保护的专业性,以先进信息技术让古籍文献源远流长,让其变为经典阅读的重要源泉。
2 数字人文时代图书馆古籍文献数字化建设的常用技术
数字人文时代各种前沿技术的应用,颠覆了传统的信息资源整合传播方式,也改变了人们对信息的利用习惯。将这些前沿技术应用于图书馆古籍保护工作中,将促进古籍文献从采集、检索到利用等多个环节质的飞跃,全面提高古籍文献管理的智能化水平。
2.1 文本挖掘技术的应用
文本挖掘是从语料库或文本集合中信息抽取,从中发现潜在的、有价值的知识。文本挖掘技术是数据挖掘的分支,可以满足古籍文献的深层次挖掘
[3]
需求 。图书馆在对古籍文献进行数字化处理过程中,借助该技术分析古籍文献的人物关系、篇章结构等,或者对大规模文献进行整体分析,可以把握某一时期、流派或作者的风格特点,摆脱依赖权威的传统人文研究方法,在对比分析上厘清不同文本之间复杂的关系,从中提炼可供传播的知识与经验。针对历史档案资料,研究者也可以借助文本挖掘技术,对同类作品进行校勘对比,深入挖掘同一时期人们对社会、人文等方面认知的差异,进而更为准确地还原历史真相。
2.2 地理信息系统的应用
地理信息系统( Geographic Information System , GIS)是在对大量空间数据进行采集、组织与分析基础上,将事物的属性数据与空间数据相结合,帮助用户提高信息查询效率的应用软件。GIS 技术在图书馆古籍文献数字化中的应用,可以在计算机中迅速整合空间数据,呈现独特的地图分析、视觉化与信息分层方式,获得包含时间与空间两重维度的检
[4]
索结果,提高检索的准确与直观性 。如针对特定作者,可以借助该技术自动采集分析其综合信息,
[5]生成作者生平的行踪路线图 。GIS 为用户提供了全新的检索入口,方便图书馆在古籍文献数字化基础上,促进古籍文献图表化、可视化,生成动态古籍数字化地图,以清晰的知识图谱体系,提高古籍文献的易读性,扩大古籍文献的传播范围。
2.3 知识发现技术的应用
图书馆古籍文献类型复杂,为避免重复建设和资源浪费,可以利用知识发现技术建立文献管理系
[6]
统,实现古籍文献的高效整合与科学管理 。该系统分为古籍导入、分类管理、知识发现检索等模块,可以通过馆藏文献调取、网络资源采集和自动扫描识别等方式,将既有的古籍文献资源导入原始数据库中,并对原始数据进行分类处理,根据分类结果设计检索页面,依托知识发现获得有价值的知识,满足用户的全文检索需求。系统运行过程中,知识发现技术的作用在于从大量文献中自动提取特征信息,然后借助神经网络与决策树等,对不同的
[7]
特征项进行分类,赋予对应项目唯一的标识 。此后对这些文献资源进行相关性分析,发现不同数据之间的隐含关系,从中挖掘有价值的知识。
3 数字人文时代图书馆古籍文献专题数据库的构建
数字人文时代数字化资源的应用日益普遍,图书馆有必要应用数字化技术,建立古籍文献资源专题数据库,不断补充与完善数据信息,更好地满足古籍文献的长期保存需求。
3.1 数字化工具的选择
移动信息技术的广泛应用,推动了图书馆数字化建设的进程,很多新的数字化处理工具被开发出来,也为古籍文献的数字化保存提供了可行方案。例如方正集团研发的古籍资源数字化加工系统,可以实现对古籍文献的全文数字化,加工准确度高,为用户对古籍资源的全文检索、阅读与分析提供了便利。图书馆在古籍文献数据库建设的准备阶段,要根据馆藏规模与需求,选择优质数字化供应商合
[8]
作,切实保障数字化处理工具的性能 。在数据库设计方面,尽量选择高吞吐量、兼容性好的内部数据存储器,满足对大规模数据的实时统计、存储与调用需求,避免由于频繁读取导致的系统卡顿与延迟。
3.2 数据库建设步骤与方法
图书馆古籍文献数据库的构建耗资巨大,涉及范围广,建设周期长。为了降低建库成本,提高建库效率,图书馆可以通过以下步骤保障建库的有效性。首先,做好古籍文献采访工作。目前很多商业信息机构存储有数字化古籍文献资源,图书馆为拓展古籍来源,可以与这些商业机构合作,直接购买
[9]
他们的数字化产品 。其次,对网络资源进行链接与整合,可以利用网页检索工具,实现对这些资源的迅速采集,并直接填充至专题数据库中。此外,做好古籍文献资源的分类整理工作,借助数字化工具进行深入挖掘,形成可视化的古籍资源地图,满足用户的多元化检索需求。如国家图书馆建立的“全文影像数据库”,涵盖敦煌遗珍、数字方志等内容,可以满足用户的关联检索、高级检索等个性化需求。
3.3 数据库工作流程与规范
图书馆做好古籍文献数字化处理后,还需要设置合理的数据库运作规范,保障数据库的合理使用(见图 1)。对古籍文献的采集整理,要求设计统一的采访、编目与阅览标准,避免重复建设和资源浪费。在古籍文献数字化制作阶段,需要做好图文对照、特征匹配和专业校对等工作,然后对这些资源进行排序整理,保障入库信息的完整、准确、有序性。对古籍文献的数字化存储,可以设置包括分类扫描、信息识别、图像处理等在内的操作流程,针对每个环节设计合理的操作标准,要求馆员严格执行。此外,保障数据库检索界面的简洁友好性,设置资源导航、联机字典等辅助功能,方便用户的便捷、高效检索,并可以在古籍文本与图片预览之间自由切换。4 数字人文时代图书馆古籍文献的长期保存机制
由于长期以来受到管理体制的制约,不同古籍管理机构之间各自为政,对古籍文献的采集、修复、挖掘与管理力度不够,缺乏共享渠道,尚未建立可靠的古籍长期保存机制。为此,图书馆有必要发挥自身优势,积极承担起保护与挖掘古籍文献的重任,联合其他信息机构,共同建立完善古籍开发与保存机制,促进我国古籍保护事业的发展。
4.1 建立统一的古籍长期保存标准
数字人文时代古籍文献的研究利用价值进一步凸显,图书馆在强化古籍数字化建设的同时,也有必要联合博物馆、出版社、地方志研究所等机构,共同探讨古籍文献的数字化保存标准,建立统一规范的古籍保存标准体系。这是因为古籍文献种类复
杂多样,若编目、存储标准不统一,将直接制约古
[10]
籍的可持续开发 。地方政府在古籍保护方面,要发挥牵头和引领作用,指导图书馆等文献存储机构协同合作,成立专门的古籍文献开发标准委员会,专门负责标准制定与调整工作,建立古籍开发、评价与保存的严格技术体系。各级信息机构要严格规范,做好古籍文献数字化建设工作,并保障数据格式、编目规则、应用系统的统一性。
4.2 建立古籍文献保护人才培养机制
在古籍文献保护方面,目前很多机构存在规模不完整、修复技术落后、保护人才匮乏等问题,导致很多珍贵的民族文化遗产毁损或流失。我国一些学者也指出,如今精通古籍修复与研究的人员越来越少,后继人才青黄不接。由于古籍文献的保护与利用,对相关管理者的要求较高。为了保障可靠的人才储备,国家要尽快建立古籍保护人才培养方案,指导各级高校设置古籍保护专业,或开设与古籍保护相关的课程,让更多的年轻人加入到古籍保护工作中。图书馆也可以与其他机构合作,强化古籍保护人员的在职培训工作,指导他们掌握与古籍翻译、编目、修复等相关的技能,以更好地实现古籍长期保存的目标。
4.3 促进古籍文献资源数字化共享
图书馆开展古籍文献数字化建设的目标之一,就是促进古籍典藏共享,让更多的人认识到古籍的应用价值。随着古籍数字化保护工作的推进,很多古籍存储机构建立了古籍全文数据库或书目数据库,实现了古籍文献的全文数字化和快速在线检索。然而部分机构将古籍文献作为特色馆藏,不愿意与其他机构共享,不仅导致古籍数字化的重复建设,也势必增加资金、人力成本。只有各级信息机构联合起来,在古籍文献保护方面合理分工,充分利用数字化技术建立区域乃至全国性的数据库,形成古籍文献自由流通的在线共享平台,才能真正提升古籍的利用水平。
5 小结
古籍文献资源是我国珍贵的历史遗存,是中华文明演变的见证者,在弘扬民族文化和促进中外交流方面发挥着重要作用。数字人文时代各类先进技术的应用,促进了古籍文献数字化建设,更加强调知识挖掘与信息共享。图书馆作为古籍存储机构,有必要引入新理念与新技术,将数字人文思想融入古籍文献保护中,从先进的数字化实践项目中吸取经验,与信息机构开展广泛合作,全面提高古籍整合质量,实现古籍保护事业的可持续发展。
参考文献
[1] 陈畅.论古籍资源数字化的信息资源建设[J].山西科技,2017,33(2): 73-74,77. [2]韩晶.新疆古籍文献资源数字化保护探析 [J].图书馆学刊, 2015(11):59-61. [3] 文秀华,王莲霞.新媒体环境下高校图书馆古籍的阅读推广[J].农业图书情报学刊,2017,29(12):143-146. [4] 王向真.基于地理信息系统的图书馆读者借阅行为研究[J].中国中医药图书情报杂志,2014,38(5):19-22. [5] 钟劲松.文化传承视角下公共图书馆古籍保护问题与对策[J].图书馆学刊,2018(4):26-29. [6] 左瑾.公共图书馆古籍资源数字化开发与阅读推广研究[J].图书馆学刊,2017(12):67-70. [7] 李小平,张忆雄,沈洋,等.医药古籍文献数字化标准体系的构建[J].中华医学图书情报杂志,2017,26(1):11-14. [8] 曹丽.大数据环境下高校图书馆古文献资源数字化现状分析[J].图书情报导刊,2016,1(2):1-3,8. [9]吴茗.提高古籍数字资源服务质量的实践与思考[J].情报探索, 2016(8):102-105. [10] 温丽君.论数字化时代高校图书馆纸本文献资源建设[J].中国中医药图书情报杂志,2015,39(6):27-29.
(收稿日期:2018-12-14) (修回日期:2018-12-21;编辑:魏民)