CJLIS (Traditional Chinese Medicine)

我国中医计算机辅助诊­断研究热点与趋势的知­识图谱分析

1,李宗友1,赵攀 2,杨硕1,刘成源 3*

- 石英杰

1.中国中医科学院中医药­信息研究所,北京 100700;2.中国中医科学院眼科医­院,北京 100040; 3.国家中医药管理局服务­中心,北京 100027

摘要:目的 分析我国近 40 年中医计算机辅助诊断­研究的相关文献,探索该领域发展现状、研究热点及前沿动态,为后期研究提供参考和­借鉴。方法 检索中国知识资源总库(CNKI)自建库至 2020年 10 月 31日发表的中医计算­机辅助诊断研究相关文­献,运用CiteSpac­e v.5.7.R2 软件对发文量、作者、发文机构、关键词进行分析挖掘,并绘制相关科学知识图­谱。结果 共纳入文献 428 篇,最早关于中医辅助诊断­研究的论文发表于 1981 年。近 40 年来,中医计算机辅助诊断研­究有 2 个研究高峰时期,分别为 1989-1992 年和 2001-2010 年。主要合作团队有吕汉兴­团队、李海鲲团队、杨学智团队和温川飙团­队,形成以北京中医药大学、湖南中医药大学、南京中医药大学为核心­的研究机构网络,研究机构之间合作较少。中医类研究机构占比 44.40%,非医学类研究机构占比 36.51%。研究内容集中在中医专­家系统、中医电脑诊疗系统、中医辨证论治模型、中医诊断客观化、中医诊断智能化 5 个方面;前沿热点主要集中在中­医药的知识发现、人工智能、机器学习、神经网络、知识图谱研究等方面。结论 随着信息技术的进步和­大数据、人工智能技术的广泛应­用,中医计算机辅助诊断逐­渐客观化、精确化、智能化,其研究深度和广度也不­断拓展和延伸。关键词:中医;辅助诊断;CiteSpace;科学知识图谱;热点;演变趋势中图分类号:R2-03 文献标识码:A 文章编号:2095-5707(2021)02-0011-08

DOI: 10.3969/j.issn.2095-5707.2021.02.003 开放科学(资源服务)标识码(OSID):

Knowledge Map Analysis on Research Hotspots and Trends in Computer-aided Diagnosis of TCM in China SHI Ying-jie1, LI Zong-you1, ZHAO Pan2, YANG Shuo1, LIU Cheng-yuan3*

(1. Institute of Informatio­n on Traditiona­l Chinese Medicine, China Academy of Chinese Medical Sciences, Beijing 100700, China; 2. Eye Hospital, China Academy of Chinese Medical Sciences, Beijing 100040, China; 3. Service Center of National Administra­tion of Traditiona­l Chinese Medicine, Beijing 100027, China)

Abstract: Objective To analyze the relevant literature of research on computer-aided diagnosis of TCM in the past 40 years in China; To explore the developmen­t status, research hotspots and frontier trends of this field; To provide reference for further research. Methods Research related literature on computer-aided diagnosis of TCM published by CNKI from its establishm­ent to October 31, 2020 was retrieved. CiteSpace v.5.7.R2 software was used to analyze and mine the amount of articles, authors, publicatio­n organizati­ons, and keywords, and

基金项目:国家重点研发计划(2017YFB100­2300)第一作者:石英杰,E-mail: ying153@163.com *通讯作者:刘成源,E-mail: 1360107780­7@139.com

relevant scientific knowledge maps were drawn. Results Totally 428 articles were included, and the earliest article on the research of auxiliary diagnosis of TCM was published in 1981. In the past 40 years, there have been two research peak periods for computer-aided diagnosis of TCM, namely 1989–1992 and 2001–2010. The main cooperatio­n teams included Lu Hanxing’s team, Li Haikun’s team, Yang Xuezhi’s team and Wen Chuanbiao’s team, forming a network of research institutio­ns centered on Beijing University of Chinese Medicine, Hunan University of Chinese Medicine, and Nanjing University of Chinese Medicine. There was little cooperatio­n between research institutio­ns. TCM research institutio­ns accounted for 44.40%, and non-medical research institutio­ns accounted for 36.51%. The research contents focused on five aspects: TCM expert system, TCM computeriz­ed diagnosis and treatment system, TCM syndrome differenti­ation and treatment model, TCM diagnosis objectific­ation, and TCM diagnosis intelligen­ce; frontier hotspots mainly focused on knowledge discovery, AI, machine learning, neural networks, and knowledge map research on TCM. Conclusion computerai­ded diagnosis of TCM has gradually become objectifie­d, precise and intelligen­t, and its research depth and breadth have also been continuous­ly expanded and extended.

Key words: TCM; aided diagnosis; CiteSpace; scientific knowledge map; hotspots; evolution trend

中医药是中华民族的原­创科学,数千年来为中华民族的­健康做出了巨大贡献。2019 年 10 月,习近平总书记对中医药­工作作出重要指示,强调要遵循中医药发展­规律,传承精华,守正创新,加快推进中医药现代化、产业化[1]。利用计算机技术构建

中医药知识体系,探索与发现中医药规律,实现基于中医辨证论治­的个性化诊疗,是有效解决中医药传承、发展和创新问题的方法­之一。中医辅助诊断系统通过­现代化的诊疗设备进行­中医四诊信息客观化、量化,可以提升临床工作者的­辨证准确度、减少人为医疗错误[2]。

在多学科交叉融合快速­发展的大背景下,科学知识图谱工具可以­帮助学者弥补对跨学科­领域认识的不足。本文通过文献计量学方­法和知识图谱可视化工­具,对中国知识资源总库(CNKI)已发表的中

医计算机辅助诊断研究­的期刊论文及硕士、博士学位论文的发文量、作者、发文机构、关键词等进行分析,挖掘中医计算机辅助诊­断的研究热点及研究趋­势,期望发现中医辅助诊断­研究的发展脉络及未来­发展的方向。

1 资料与方法

1.1 数据来源与检索策略

以中国知识资源总库(CNKI)为数据来源,运用主题检索方法,检索式为:SU=('辅助诊断' + '辅

助诊疗' + '辅助辨证'+ '智能诊断'+ '智能诊疗' + '诊

断系统' + '诊疗系统'+ '专家系统'+ '问答系统' + '辅

助决策' + 'CDSS') * '中医'。检索时间范围自建库至­2020 年 10 月 31日,检索时间 2020 年 11 月 1 日。

1.2 纳入与排除标准

纳入标准:⑴中医计算机辅助诊断相­关研究,包括理论研究、辨证论治模型研究、专家系统相关研究、辅助诊断相关技术应用­及实验研究、辅助诊断系统临床验证­研究等;⑵文献类型为期刊论文、硕士及博士学位论文。

排除标准:⑴与中医计算机辅助诊断­研究无关的文献;⑵纪实报道,缺少作者或机构信息,综述、会议论文及成果展示等­文献。

1.3 数据处理

将检索到的文献以 Refworks 格式导出,保存为

download_***.txt 文档,内容包括作者、发文机构、论文题目、发表年份、关键词、摘要、期刊、卷次、起止页码等。

在导出的.txt 文档中,对标点、分隔符等进行校对,避免因源数据格式不规­范影响数据挖掘结果的­准确性。发文机构以论文实际标­注为准,考虑到标注的机构名称­分级差异较大,对机构名称进行适当整­理,如将“上海医科大学附属肿瘤­医院中医科”统一为“上海医科大学附属肿瘤­医院”。因存在研究机构更名情­况,本文保留原始名称进行­分析。

1.4 研究方法

采用 CiteSpace v.5.7.R2 软件将文献转换为

download_***_converted.txt 格式,在“功能与参

数”页面建立“New Projects”——中医辅助诊断,

参数设置为默认值。

数据分析参数设置:时间跨度 1981 年 1 月- 2020 年 10 月,时间切片为 1。“Node Types”(节

点类型)选择 Author(作者),TopN 取值为 50%,未选用网络裁剪;“Node Types”选择 Institutio­n(机构),TopN 取值为 100%,未选用网络裁剪;“Node Types”选择 Keyword(关键词),g-index 中 k= 30,网络裁剪选用寻径网络­算法(Pathfinder)。其余

参数为默认值。

2 结果与讨论

根据检索策略检索文献 663 篇。按纳入与排除标准筛选­后,最终共纳入 428 篇,包括期刊文献278篇、硕士学位论文119篇、博士学位论文31 篇。2.1 发文时间分布

中医计算机辅助诊断研­究论文发文量随时间变­2.2 作者分布

发表中医计算机辅助诊­断研究论文的作者共6­63 位,其中发文≥4 篇的作者共 12 位,占 1.81% (见表1);发文≥3篇的作者共34 位,占 5.13%。

对发文作者进行共现分­析,见图 2。图谱中的节点代表作者,节点半径越大表明发文­量越多;节点间的连线代表 2 个作者的共现关系,连线越粗表示合作越密­切。结果显示,节点数 N=63,连线数E=78,表明共出现作者 63 位,作者之间合作关系78 个,模块值(Q 值)=0.826 3,平均轮廓值(S

化曲线见图 1。从图中可以发现,最早关于中医辅助诊断­研究的 2 篇论文发表于 1981 年[3-4],说明 20世纪 80 年代初已有学者开始从­事中医计算机辅助诊断­的研究。1989-1992 年关于中医计算机辅助­诊断的研究达到了第 1 个高峰期。但是从 1993 年开始发文量明显减少,1998 年发文量仅有 1 篇,说明该领域研究热度明­显下降。2001-2010 年,中医计算机辅助诊断研­究再次成为研究热点,其中 2008 年的年发文量达 34 篇,是近年来发表论文最多­的一年。2011-2019 年,年均发文量 19 篇,研究热度处于稳步升温­的过程。由于 2020 年数据不完整,本研究不进行分析。值)=1。一般 Q 值越接近 1 说明聚类效果越好,

S>0.5 表明聚类合理,S>0.7 表明聚类可信[5]。

根据图谱和共现作者发­文量分析,发文作者形成了 4 个较稳定的核心团队:吕汉兴团队来自华中科­技大学,属非中医类团队,主要从事中医专家系统­研究,发文主要集中在 20 世纪 80 年代末,是中医计算机辅助诊断­研究最早的代表团队;李海鲲团队来自合肥工­业大学,属非中医类团队,主要应用不同理论模型­研究中医辅助诊断及专­家系统,发文主要集中在 2001-2010 年,是中医计算机辅助诊断­研究第二次成为热点时­的核心团队;杨学智团队来自北京中­医药大学,主要研究四诊合参辅助­诊疗的数字化和智能化,发文时间在 1999-2019 年,研究持续达 20 年,是一个稳定的中医类团­队;温川飙团队来自成都中­医药大学,主要应用人工智能技术­研究中医计算机辅助辨­证论治,发文集中在 2015 -

2020 年,是近年来新的核心团队。而图谱中其他几个团队­如李肇夷、杨健、陈国宁、陈曦、刘健等在

发文 1~2 篇后再无相关研究,说明未形成稳定的研究­团队。以上 4 个稳定的团队所处时间­跨度较长,并且团队之间合作较少,中医和计算机专业团队­还未形成成熟的跨学科­合作模式。2.3 发文机构分布

对研究机构进行共现分­析,见图 3。共现图谱

中的节点代表发文机构,节点半径越大表明该机­构发文量越多;节点间的连线代表 2 个机构的共现关系,连线越粗表示合作越密­切。结果显示,节点数N=241,连线数 E=89,Q 值=0.931 6,S 值=1,表明共出现研究机构 241 个,机构之间共有 89 个合作关系,机构之间合作较少,主要以中医药院校和其­附属医院合作为特点,形成了以北京中医药大­学、湖南中医药大学、南京中医药大学为核心­的研究机构网络。发文量前 2 位的研究机构为北京中­医药大学(11篇)、湖南中医药大学(5篇),见表2。

2010 年之前,北京中医药大学各学院­及其附属医院的研究主­要以数字化中医诊断系­统研究为主, 2010 年之后,中医四诊合参的数字化­和量化研究发文逐渐增­多,成为研究的主要方向。湖南中医学院

于 2006 年更名为湖南中医药大­学,2 个机构共发文

9 篇,仅次于北京中医药大学。湖南中医药大学中

医计算机辅助诊断研究­具有时间上的连续性,2010年以前主要研­究中医专家系统及以朱­文峰团队为核

心开发的 WF 文锋-Ⅲ中医(辅助)诊疗系统;2010年以后引入人­工智能技术研究智能化­辨证方法。南京中医药大学相关机­构集中在专病的专家系­统或辅助诊断系统研究,研究时间为 1999-2020 年。

通过统计分析发现,中医药院校和科研机构­发文量较大(见表 3)。医学类研究机构共 153 个,其中中医类研究机构 107 个,占总体的 44.40%。中医计算机辅助诊断研­究不仅涉及医学类研究­机构,而非医学类研究机构占­比达到了 36.51%,说明中医计算机辅助诊­断研究在计算机领域也­引起了普遍关注和研究,属于交叉学科研究领域。

综合发文作者与发文机­构的数据发现,发文量较大的研究机构­与研究团队,只有北京中医药大学和­成都中医药大学的研究­团队相对应,而非中医药类研究机构­虽然开展计算机辅助诊­断研究较早,但研究方向与发文持续­时间不够稳定,参与的机构和人员分布­比较分散。

2.4 中医计算机辅助诊断研­究热点分析

通过 CiteSpace v.5.7.R2 软件进行关键词聚类分­析,生成关键词聚类图谱。共计出现关键词 739个,关键词之间的共现关系­有 1439 个,聚类分析后

Q 值=0.789 1,S 值=0.927,表明关键词聚类效果较­好,结果可信。出现频次≥6 的关键词见表 4,生成的关键词聚类图谱­见图 4,在“Cluster Explorer”中选取前 12 个聚类标签,通过 LLR 算法提取聚类

标签词。聚类号与聚类大小成反­比,最大聚类以#0标记,同时选取出现频次≥3的关键词形成表5。

通过对表 4、图 4、表 5 结果进行分析,排除中医、中医药等中医类关键词­后,将中医计算机辅助诊断­研究内容归纳为以下几­点:

⑴中医专家系统研制。相关关键词有人工神经­网络、不确定性推理、模糊数学、推理过程、专家系统工具、中医诊疗、中医专家、老中医、系统研制。中医专家系统的研究从 20 世纪 80 年代开始至

今[6-7],一直是研究的热点之一。在研究名老中医学

术思想和挖掘名老中医­经验的基础上,借助计算机技术,构建中医专家数据库,应用数学理论和推理模­型研制中医专家系统并­应用于临床辅助决策和­中医诊断教学中,是中医药传承和现代化­的有效途径。

⑵中医电脑诊疗系统的研­究。相关关键词有知识库、数据库、知识表示、知识获取、知识图谱、模式识别、模糊逻辑、知识工程、知识发现、辨证、伤寒论、证素、中医辅助诊疗系统、临床应用、中医体质、大数据、高血压。电脑诊疗系统不同于专­家系统,而是以中医药知识工程­为基础,构建中医药知识库,在知识表示和知识获取­的基础上,研究中医药知识发现,同时引入了知识图谱、数据挖掘等新技术,将中医临床辅助诊断的­适用范围从临床诊疗延­伸到健康管理等领域中。中医电脑诊疗系统是对­中医专家系统的扩展和­延伸,以实现

更多的功能[8-12]。

⑶中医辨证论治模型研究。相关关键词有粗糙集、神经网络、关联规则、属性约简、支持向量机、中医辅助诊断。中医辨证论治模型是对­中医认知模式和中医辨­证论治的模型化表示,通过借助数学模型和算­法、信息化技术,构建辨证论治模型,应用于中医辅助诊断系­统中,辨证论治模型是中医

计算机辅助诊断系统运­行的核心[13-17]。

⑷中医诊断客观化研究。相关关键词有中医辨证、脉诊、推理机、分类、中医舌诊专家系统、传统中医、诊断、计算机中医诊疗系统、经络。传统中医的辨证诊断主­要以定性为主,较多依赖主观因

素,较少借鉴客观化、量化指标[18]。计算机的数据

处理需要精确的数据支­撑,因此,中医诊断的客观化和量­化研究也是举足轻重的。目前以舌诊、脉诊

和经络诊断的量化、客观化研究为主[19-23]。

⑸中医诊断智能化研究。相关关键词有人工智能、机器学习、人机交互、中医按摩机器人、数据挖掘、四诊合参辅助诊疗仪、属性偏序结构图、智能诊断、亚健康、案例提取网、健康管理、智能问答。随着信息技术的进步,大数据、人工智能技术的广泛应­用,越来越多的学者开始研­究人机交互的智能诊断、智能问答、中医领域知识图谱构建­等新兴的解决方案,并且在亚健康、体质学饮食、中医按摩等方向开展了­研究,这些主题将会是今后的­热

点主题[24-27]。

2.5 突现词分析

通过 CiteSpace 的时区图可以发现研究­热点随时间的演变,对关键词进行突现分析­可以发现高突现值的关­键词热点,推测中医计算机辅助诊­断研究的前沿主题和发­展趋势。对关键词进行时区分析,见图5。结果显示,节点数 N=361,连线数 E=580,聚类分析后,Q 值=0.77,S 值=0.897 9。

在图 5 基础上分析突现词,选取 Top22 的关键词进行分析,见图6。

由图 5 可以看出,中医计算机辅助诊断研­究的第 1 个高峰期(1985-1995 年),主要围绕中医专家系统­和中医知识库的研究,侧重于数据模型和推理,并且提出了人工智能在­中医诊断中的应用。第2 个高峰期(2001-2010 年),研究重点为数据挖掘和­知识表示在中医辅助诊­断中的应用,侧重于诊断模型的构建。第 3 个阶段(2011 年-至今),时区图中关键词以知识­发现、大数据、机器学习、知识图谱、智能问答为核心。

近期前沿热点和趋势主­要围绕中医药的知识发­现、人工智能、机器学习、神经网络、知识图谱研究,说明近期和未来一段时­间的研究热点有可能侧­重于以中医药大数据为­基础,通过机器学习、神经网络、知识图谱等新技术和新­方法,助力人机交互的智能化­中医辅助诊断研究。

3 小结

本文通过 CiteSpace 软件对 CNKI 发表的中医计算机辅助­诊断研究相关论文进行­文献计量学和知识图谱­可视化分析,通过发文量统计、作者及研究机构的知识­图谱和关键词的共现与­聚类图谱数据,了解中医计算机辅助诊­断研究领域研究主题随­时间的演变,可以清晰看出 2 个该领域研究的高峰及­研究主题的变化,随着计算机和信息技术­的不断更新迭代,机器学习、神经网络、知识图谱等新方法的出­现,以中医药大数据为基础­的人工智能研究很有可­能成为将来的研究热点。

参考文献

[1] 新华网.习近平对中医药工作作­出重要指示强调 传承精华守正创

新 为建设健康中国贡献力­量 李克强作出批示[J].(2019-09-25) [2020-11-01].http://www.xinhuanet.com/politics/leaders/201910/25/c_1125151959.htm. [2] 姚敬心,邓文祥,李静,等.中医辅助诊疗系统在医­疗活动中的应用现

状及发展分析[J].中国中医药现代远程教­育,2019,17(15):55-57.

[3] 陈道灼,孙建嵩,林炳承,等.林如高骨伤电脑诊疗系­统骨折部分研制

简介[J].福建中医药,1981(4):12-15,8.

[4] 陈德济,张景芳,朱学增.中医痹证计算机辅助诊­断系统[J].计算机应

用通讯,1981(0):1-5.

[5] CHEN C M, CHEN Y, Horowitz M, et al. Towards an explanator­y

and computatio­nal theory of scientific discovery[J]. Journal

of Informetri­cs, 2009,3(3):191-209.

[6] 年玮.脏腑辨证专家系统在中­医诊断教学中的使用研­究[J].电子世

界,2013(21):163-164.

[7] 彭春龙,付卓,庞玉文,等.一个能从病例中自动获­取知识的中医专家

系统生成软件[J].微型机与应用,1989(1):27-29.

[8] 程良铨,孙德保,吕汉兴,等.数据库及知识工程在中­医专家系统中的

应用[J].华中理工大学学报,1989(5):15-20.

[9] 罗计根.面向中医领域知识图谱­构建的关键技术研究及­应用[D].南

昌:江西中医药大学,2019.

[10] 杨永锋.大数据在中医领域中的­应用[J].甘肃科技,2020,36(15):

14-16.

[11] 杨丽.基于知识推理的中医临­床诊疗决策支持方法研­究[D].北京:北

京交通大学,2014.

[12] 赵文,李书楠,徐佳君,等.智能化中医辅助诊疗系­统模型构建[J].中

华中医药杂志,2020,35(5):2421-2424.

[13] 党春艳.新属性约简算法在脾胃­辨证分型中的应用研究[D].广州:暨

南大学,2010.

[14] 邹伟伟.中医儿童性早熟智能诊­断算法研究[D].上海:东华大学,2012.

[15] 王合山.基于遗传算法的模糊神­经网络及其在中医类风­湿性关节炎

诊断中的应用研究[D].昆明:昆明理工大学,2005.

[16] 秦中广.基于粗糙集的交叉研究­及其在中医诊断的应用[D].广州:华

南理工大学,2002.

[17] 李四海,吕晓云.D-S 证据融合的中医辨证模­型[J].计算机工程与应

用,2014,50(15):240-243.

[18] 李家星,林凌,宋俊生,等.中医证候定量诊断的研­究现状与思路概

述[J].中医杂志,2010,51(10):950-952.

[19] 栾景民.基于属性偏序结构数学­原理的中医数量化辨证­诊断辅助系

统研究[D].秦皇岛:燕山大学,2014.

[20] 李慧,张尚尚,芦煜,等.2 型糖尿病中医数字化、量化的四诊特征研

究[J].云南中医学院学报,2015,38(2):43-46.

[21] 张莹莹.基于知识图谱的舌像诊­疗系统研究与构建[D].成都:电子科

技大学,2019.

[22] 王燕.中医脉象客观定量化理­论方法研究[J].世界科学技术-中医

药现代化,2005,7(1):118-122,143.

[23] 王光文.人体经络数据库及辅助­诊疗系统的研究[D].济南:山东大

学,2010.

[24] 李江平,韦玉科.亚健康中医诊断系统[J].计算机工程,2005,

31(15):222-223,231.

[25] 付德坤.基于模糊决策的体质学­饮食推荐建模及其系统­实现[D].成

都:电子科技大学,2013.

[26] 刘玲云.中医按摩机器人专家系­统的研究[D].济南:山东建筑大学,

2016.

[27] 任薇,彭宁,范会丽.基于传统规则的中医知­识智能问答系统研究[J].

电脑知识与技术,2019,15(32):200-201. (收稿日期:2020-11-25) (修回日期:2020-12-28;编辑:郑宏)

 ??  ??
 ??  ??
 ??  ??
 ??  ?? 图 3 428篇中医计算机辅­助诊断研究文献机构共­现图谱
图 3 428篇中医计算机辅­助诊断研究文献机构共­现图谱
 ??  ?? 图 2 428篇中医计算机辅­助诊断研究文献作者共­现图谱
图 2 428篇中医计算机辅­助诊断研究文献作者共­现图谱
 ??  ?? 图 4 428篇中医计算机辅­助诊断研究文献关键词­聚类图谱
图 4 428篇中医计算机辅­助诊断研究文献关键词­聚类图谱
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ?? 图 5 428篇中医计算机辅­助诊断研究文献关键词­时区图
图 5 428篇中医计算机辅­助诊断研究文献关键词­时区图
 ??  ?? 图 6 428篇中医计算机辅­助诊断研究文献关键词­突现图
图 6 428篇中医计算机辅­助诊断研究文献关键词­突现图

Newspapers in Chinese (Simplified)

Newspapers from China