大数据背景下我国壮药领域研究的可视化分析

范建华 1 ,满小露1 ,梁敏 1 ,钟鸣 1 ,邓鑫 2 ,尤剑鹏2 1.广西中医药研究院,广西 南宁 530022;2.广西中医药大学,广西 南宁 530001

CJLIS (Traditional Chinese Medicine) - - 目 次 -

【引文格式】范建华,满小露,梁敏,等.大数据背景下我国壮药领域研究的可视化分析[J].中国中医药图书情报杂志,2018,42(3): 16-22.

摘要:目的 壮医药是祖国传统医学的重要组成部分,利用科学知识图谱对壮药研究领域热点探析。方法 检索的主题=“壮药”,以 2007-2016 年 CNKI 数据库收录的 620 篇壮医药论文为研究对象,运用 Ucinet 和 CiteSpace V 可视化软件绘制作者、机构、高频关键词网络图谱和壮药研究时间分区图谱,把 2007-2016 年分成 2007-2011 年(第一阶段)和 2012-2016 年(第二阶段)2 个阶段,进行对比。结果 在壮药研究领域高频作者中广西的作者占 95.7%(89/93),广西发文机构占 75.81% (47/62),每篇文献由 1 位或 2 位作者完成的比例第二阶段比第一阶段明显减少,由 3 位作者共同完成两个阶段的比例变化不大,而由 4~8 位作者共同完成的比例第二阶段比第一阶段明显增加。通过高频关键词社会网络图谱和壮药突现词的时间分区图谱分析,壮药现阶段研究热点集中在临床观察、化学成分、壮医药、薄层色谱法、质量标准等,并形成以质量控制、腰肌劳损、鲫鱼胆、疗效评价、小鼠等研究发展前沿。结论 壮药领域的科研人员、科研机构合作意识增强,应加强同国内外著名的中医药研究机构合作,揭示近十年来我国壮药研究现状和发展趋势。

关键词:壮药;高频关键词;可视化;研究热点;趋势;数据挖掘

DOI: 10.3969/j.issn.2095-5707.2018.03.004

中图分类号: G350;R28 文献标识码: A 文章编号: 2095-5707(2018)03-0016-07

Visualization Analysis of Research on Zhuang Medicine in China under the Background of Big Data

FAN Jian-hua1, MAN Xiao-lu1, LIANG Min1, ZHONG Ming1, DENG Xin2, YOU Jian-peng2

(1. Guangxi Institute of Traditional Medical and Pharmaceutical Science, Nanning 530022, China: 2. Guangxi university of Chinese Medicine, Nanning 530001, China)

Abstract: Objective To use scientific knowledge maps to analyze the hot spots of Zhuang medicine, because Zhuang medicine is an important part of traditional medicine in China. Methods The theme of the search was "Zhuang Yao", and 620 articles about Zhuang medicine included in the CNKI database from 2007 to 2016 were taken as research objects. Ucinet and CiteSpace V visualization software were used to draw authors, institutions, high-frequency keyword network maps and Zhuang medicine research time-frequency spectrum. 2007-2016 was divided into 2007-2011 (first phase) and 2012-2016 (second phase) two stages for comparison.

Results Among the high-frequency authors in Zhuang medicine research field, the authors of Guangxi accounted for 95.7% (89/93), and Guangxi publishing agencies accounted for 75.81% (47/62). The proportion of each article completed by one or two authors was significantly lower in the second stage than in the first stage. The ratio of the two stages completed by three authors did not change much, but the proportion of each article completed by four to eight authors was significantly lower in the first stage than in the second stage. Through analysis on keywords social network map and time-frequency spectrum of Zhuang medicine emergence words, the research of Zhuang medicine focused on the clinical observation, chemical compositions, Zhuang medicine,

TLC, quality standards and so on. Quality control, muscle strain, crucian carp, efficacy evaluation, mice and other research and development frontiers were formed. Conclusion Strong awareness of cooperation among researchers and research institutes in the field of Zhuang medicine should be strengthened. Cooperation with famous TCM research institutes both at home and abroad should be strengthened to reveal the status quo and development trend of research on Zhuang medicine in our country over the past decade.

Key words: Zhuang medicine; high-frequency keywords; visualization; research hotspots; trend; data mining

广西壮族自治区壮药资源较为丰富。壮药是在壮医理论和经验指导下应用于疾病防治和卫生保健的天然药物,具有鲜明的民族性、传统性和地域性特点。已查明常用壮药有 2285 种[ 1],民间验方、秘方 30 000 多条[ 2],至今仍是人民群众赖以防病治病、保障健康的主要卫生资源之一。本文以我国壮药研究领域为对象,梳理已经发表的相关文献发现,壮医药研究主要集中在运用关联规则方法发现壮医临床治疗气道病的用药特色和组方规律[ 3],采用频数分析法对壮医治疗月经病用药类别和使用频

[4]

次进行统计分析,初步认识其用药特点和规律 。而对作者、研究机构网络关系及高频关键词的定量研究较少。本研究主要借助可视化 Ucinet 的NetDraw 和 CiteSpace V分析软件,从作者、机构合作社会网络,高频关键词等方面探析壮药研究领域热点,揭示近十年来我国壮药研究现状和趋势,以期为该领域的后续探索提供不同的研究视角。

1 资料与方法

1.1 数据来源

通过中国学术期刊网络出版总库( CNKI)获取国内公开发表的期刊文献的题目、作者、机构、摘要、关键词等。

1.2 检索方法

检索的主题=“壮药”,用精确方式进行检索。检索时间段为 2007-2016 年,检索日期截止到2017 年 6 月 2 日。将检出文献分别以 endnote 和

Refworks 格式导出。

1.3 纳入排除标准

纳入以壮医药为研究对象的文献。排除新闻、指南、摘要,论文中没有标题、作者、发文机构、关键词及摘要等类型的文献。重复发表的文献只取最早发表的一篇,必要时查看全文。

1.4 研究方法

知识图谱也被称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图。它把复

杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域,为学科研究提供切实的、有价值的参考。本文利用 CNKI 数据库自带的数据分析功能( endnote 和 Refworks)将检索含有文献标题、作者、机构、关键词、发表年份等题录数据以 endnote 格式导入书目共现分析系统,进行统计分析。对作者、机构、高频关键词分别构建共现矩阵,把共现矩阵导入 Ucinet 软件的 NetDraw,形成以##h 为扩展名的文件,最后绘制出相关共现网络图谱。而将检索到的题录数据以 Refworks 格式导入CiteSpace Ⅴ, Time Slicing=(From2007 To 2016) (# Years Per Slice 1);Term Source 全部勾选:即Title(标题)、Abstract(摘要)、Author Keywords ( DE)(作者关键词)、Keywords Plus(ID)(扩展关键词); Node 勾选 Keyword(关键词); Selection Criteria 为每个时间片前 50 个高频或高被引节点。

2 结果

初次检索获得 668 篇文献,根据纳入排除标准,最终得到 620 篇有效文献,

2.1 文献发表年代分布

将 2007-2016 年间国内壮药研究文献 620 篇导入 Excel 2007 版中,得到 2007-2016 年壮药研究文献发表年代分布图(见图 1)。2007-2010 年度发文量均在 50 篇/年以下,在国家和自治区有关中医药、壮瑶医药一系列政策引导下,壮药研究逐渐受到相关大学、科研院所、医院的重视,从 2011 年开始,发文量在 2012、2013 年出现爆发式增长, 2014年发文量有所回落,2015、2016 年的发文量又大幅增长。

2.2 高频作者合作度及作者中介中心性

随着科学研究的深入,科学创新难度的逐渐提高,学科交叉和科研人员之间的合作不断增多,科

学研究工作既需要优秀的科研带头人,也需要一个

[5]

协作的团队,科研论文合著现象已经非常普遍 。因此对论文作者合作度社会关系进行统计时,单独考虑以第一作者进行科学评价已具有局限性。为了更好地体现论文作者合作度特征,选用作者均一统

[6]

计法 能较全面地反映合著论文作者的分布情况。620 篇壮药研究论文一共有 1148 位作者参与撰写,本研究将 93 位发文频次≥ 5 篇的作者,借助 Ucinet的 NetDraw 可视化软件,导入生成好的93×93 共现矩阵,绘制出壮药研究中高频作者共现网络图(见图 2)。图中每个节点代表 1 位作者,用正方形蓝色节点表示,节点间的连线表示 2 位作者间存在合作关系。节点越大说明该作者在合作网络中具有越

为了反映作者合作度变化,把 2007-2016 年分成 2007-2011 年(第一阶段,共发文 227 篇)和2012-2016 年(第二阶段,共发文 393 篇) 2 个阶段(见表 1)。从表 1 可知,每篇文献由 1 位或

2 位作者完成的比例第二阶段比第一阶段明显减少。2 个阶段中,每篇文献由 3 位作者共同完成的比例变化不大,而每篇文献由 4~8 位作者共同完成的比例第二阶段比第一阶段明显增加。

中介中心性是社会网络分析中的重点之一,反映行动者在其社会网络中所处的地位、媒介能力及影响力,中介中心性测量的是行动者对资源控制的程度,一个行动者在网络中的中介中心性值越高,

[7]就有越多的行动者联络时必须通过他发生联系 。利用 Ucinet 对高频作者进行中介中心性测度,均取排名前 10 的作者(见表 2)。根据图 2 和表 2 可知,在壮药研究领域已形成以广西中医药大学的林辰、庞宇舟、韦松基、方刚、蔡毅和广西民族医药研究院滕红丽等为核心的科研团队。 高的中心度,即有较多的作者与该作者建立了合作关系。节点间的连线越粗表明该作者对之间的合作关系越紧密,稳定性越高。

图 2 显示, 93 位作者中有 84 位处于同一个合作网里,占 90.32%(84/93),而其中只有4 位作者属于广西壮族自治区以外的单位。在壮药研究领域高频作者中广西作者占 95.70%(89/93),而在作者

合作网络中的中介中心性> 7 的作者有林辰、余胜民、韦松基等 10 人,而中介中心性> 3 的作者有22 人。研究表明,他们是合著者中的核心人物,拥有更多的学术资源,在信息流中占有重要地位,是与其他作者联系的关键人物。通过上述计算得知,在国内壮药研究领域位于结构洞位置、承担桥梁作用的作者较多,对促进我国壮药研究学科均衡发展起到积极作用。 2.3 机构合作度分析

科研合作在知识传播中起着重要作用。机构协作网络是指为研究一个学术领域的发展变化,由相关大学、研究机构和医院建立的相互联系的网络。在这个网络中,以机构为节点,以节点之间的联线 2.4 文献研究主题与基金分布

将壮药研究文献分成 2007-2011 年和 2012- 2016 年 2 个时间段,按不同研究主题进行分类统计,结果见表 4、表 5。分析统计在 2 个时间段内各 为边。如果 2 个机构的研究人员共同撰写 1 篇论文,他们是相互关连的。本次研究的 620 篇壮药研究论文一共有 179个机构参与撰写。

从表 3 可知,每篇文献由 1 家机构完成的比例第二阶段比第一阶段明显减少,由 2~3 家机构完成的比例第二阶段比第一阶段明显增加,说明壮药研究领域机构合作意愿增加。

将其中发文≥ 2 篇的发文机构 62 家,借助Ucinet 的 NetDraw 可视化软件导入生成好的 62×62共现矩阵,绘制出壮药研究中发文机构共现网络图(见图 3)。从图 3 可知, 62 家发文机构中有 9 家是独立发文,广西的发文机构数为 47 个,占75.81%(47/62)。目前我国壮药研究领域形成巨大机构合作群,以广西中医药大学、广西民族医药研究院、广西壮医医院、广西医科大学等为核心,占据机构网络的核心地位,说明在壮药研究领域广西的研究机构占主导地位。 主题与基金对应支持的关系可以发现,制剂工艺对比增长 100%,生药鉴定对比增长 49.49%,高等教育对比增长 48.57%,临床观察对比增长 28.31%,药理研究对比增长 24.62%。

2.5 高频关键词分析

关键词在一篇论文中虽然只有 3~8 个,却是对论文主题的高度概括和提炼,因此对论文的关键词或主题词进行分析,频次高的关键词和主题词即可

[8-9]

被用来判定一个研究领域的热点问题 。词频统计法是利用关键词的出现频次高低来确定某一领域研究热点和发展动向,利用词频进行情报分析研究,可以对某些问题进行简单、明了的分析预测,且结

[10]

论较为可靠 。在导入下载标题之前,先对题录中关键词的部分近义词、同义词进行相应的归并与规范化处理,去除最高关键词“壮药”,获得 1309 个有效关键词,将频次出现≥ 4 次的 71 个关键词,借 助 Ucinet 的 NetDraw 可视化软件,导入生成好的71×71 共现矩阵,绘制出壮药研究领域关键词共现网络图(见图 4)。节点之间的连线为矩阵中的共现关系,连线的粗细表示关键词之间的紧密度,节点大小与其在共现网络地位、关键词频次成正比,节点越大,表示地位越高、越重要。

2.6 壮药研究突现词时间分区图

通过识别和跟踪学科领域的研究前沿,研究人员可以了解新出现的理论趋势和新出现的主题,然后预测学科未来的发展方向。通过 Citespace 软件中的突现词探测算法,可以从题目、摘要、关键词、标识符中提取突变的专业术语,将其中频次变化率

高的词从大量的关键词中探测出来,从而确定某学

[11]

科的研究前沿 。将检索到的题录数据以 Refworks格式导入 CiteSpace Ⅴ,在 Article Labeling 项选择By Citation 模式,阈值设定为 4、6、30,生成突现词图谱,如图 5 所示。从图中可看出壮药领域热点 3 讨论

壮药是祖国传统医学的重要组成部分,本研究利用 Ucinet 和 CiteSpace V可视化软件,对近十年壮药研究领域的作者、机构合作度及高频关键词,绘制作者、机构、高频关键词网络图谱和壮药研究时间分区图谱,政府基金对研究主题支持对比变化,对壮药研究的前沿领域和发展趋势进行分析。学科主题演化是一个复杂的过程,存在多种变量,以单一类型可视化图谱进行分析会有局限性,把不同的可视化分析工具 Ucinet 和 Citespace 综合利用,可以揭示某学科知识结构的演进和学科研究热点,有学者对比 Ucinet 和 Citespace 软件在主题演化方面的优劣[ 12],发现 Ucinet 可以通过节点、连线展示词间关 词聚集在 2007-2011 年期间,图中圆环代表壮药领域研究热点,圆环越大,关注度越大。线条表示其演化过程,图形下方代表演变年份,从图 5 较为直观地展示“壮药领域”研究前沿术语演化历程,显示壮药研究热点主题演化轨道。 系,发现核心和边缘主题词,但学科主题演化趋势展示不足; Citespace 则美观、色彩丰富,可以展示主题时间演化趋势,而主题词间关系及其内部各主题的权重不能很好的展现。

近十年来,在壮药研究领域高频作者中广西的作者占 95.7% ( 89/93 ),研究机构占 75.81% ( 47/62),均占主导地位,也占据网络的核心地位,学者们围绕核心人物形成了相对稳定的群体,但在一定程度上制约了壮药研究的发展。因此,壮药研究领域要加强同国内外著名的中医药研究机构的科研合作,提升合作水平和成果质量。“合作规模越大,论文被引次数越高”在我国医学科研人员在 SCI/SSCI 收录期刊上发表的论文得到证实。作

者数、机构数和国家数的增多均会导致论文影响力的升高。合作模式对论文影响力的促进作用按照由大到小的顺序依次为国际合作、多机构合作和多作

[13]

者合作 。

从各级政府部门(基金)对壮药研究主题支持力度的变化,对比 2 个时间段在国家级基金项目中以制剂工艺( 33.33%)、成分分析( 32.14%)、理论研究( 7.14%)、临床观察( 5.45%)获得支持较多,增长幅度较快。综合国家、省部和地市三级基金支持,从 2 个阶段主题数统计结果对比来看,增长排前五位分别是制剂工艺、生药鉴定、高等教育、临床观察和药理研究,质量标准前后五年对比基金的支持力度均保持在100%。

综合壮药研究关键词共现网络图和突现词时间分区图来看, 2007-2011 年主要热点词汇多集中在壮医药、临床观察、HPLC、药线点灸、薄层色谱法、化学成分、药理作用、提取工艺、质量标准等。2008 年 10 月出版《广西壮族自治区壮药质量标准第一卷( 2008 年版)》共收录 164 种壮药标准[ 14], 2011 年 12 月出版《广西壮族自治区壮药质量标准第二卷( 2011 年版)》共收录 211 种壮药标准[ 15],相对于有记载的 2285 种壮药,可以预见未来在相当长的时期内壮药质量标准一定是壮药研究的热点和发展方向。随着时间推移,壮药研究热点词汇逐渐向质量控制、急性肝损伤、腰肌劳损、疗效评价、鲫鱼胆、小鼠、壮药香花护乳凝胶剂等转移,预示着壮药研究在注重疗效评价基础上,加强质量控

[16]

制,发展新剂型 。

4 小结

运用大数据可视化分析方法,将复杂的数据、信息绘制成多维视觉的图形呈现是当前的研究热点。本文采用 Ucinet 和 CiteSpace V可视化软件,从三维立体角度,展现了壮药研究文献作者合作、机构合作、关键词共现网络图和突现词时间分区图谱的社会关系,其结果直观清晰,可视性更强。研究表明,利用 Ucinet 和 CiteSpace V软件,在高频关键词社会网络图谱和突现词时间分区图谱探究壮药研究热点和发展前沿时,结果基本相同。采用不同的可视化软件工具,对相关结果进行对比分析,有助于提高分析效果和准确性,从不同的研究视角为今 后的壮药研究提供参考。参考文献[1] [2] [3] [4] [5] 26.研究[J].中国中医基础医学杂志,2013,19(10):1190,1193.志,2010,25(11):1759-1761.滕红丽,梅之南.中国壮药资源名录[M].北京:中医古籍出版社,2014:12.钟鸣,容小翔.壮药理论与现代研究[M].南宁:广西科技出版社,2012:杨美春,尤昭玲,方刚.月经病的壮医用药特色研究[J].中华中医药杂庞宇舟,蒋祖玲,宋宁,等.基于关联规则的壮医气道病用药组方规律范建华,梁敏,陈明明,等.我国缺血缺氧性脑损伤幼鼠研究文献作者[6] [7]合作度分析[J].中华医学图书情报杂志,2016,25(5):58-62. 25(12):65-67.李林,李秀霞,刘超,等.跨学科知识贸易动态影响和扩散模式研究——肖慎华.合著论文作者计量方法研究[J].农业图书情报学刊,2013, [8]以图书情报学和管理学为例[J].情报杂志,2017,36(2):182-186,158. Analysis with Bailón-Moreno the Unified of the R, field Scienctometric Jurado-Alameda of physical Model. E, chemistry Ruiz-Baños Fit of of relational surfactants R, et al. and [9] activity BELVAUX indicators[J]. G, WOLSEY L A. Scientometrics, bc-prod: A Specialized 2005,63(2):259-276. Branch-andCut System for Lot-Sizing Problems[J]. Management Science, 2000,46(5):724-738. [10] 巩永强,刘莉.基于词频分析法的情报学研究热点透析[J].图书馆学研究,2011(7):9-13. [11]谭春辉,麻晓杰.我国图书馆学非正式学术共同体的形成——基于1998-2012 年《中国图书馆学报》的计量分析[J].情报杂志,2014, 33(3):64-71. [12] 刘自强,王效岳,白如江.多维度视角下学科主题演化可视化分析方法研究——以我国图书情报领域大数据研究为例[J].中国图书馆学报,2016,42(11):67-84. [13] 杜建,张玢,李阳.我国医学领域不同学科作者合作度与论文影响力的关系[J].中华医学图书情报杂志,2012,21(3):18-23. [14] 广西壮族自治区食品药品监督管理局.广西壮族自治区壮药质量标准 第一卷 (2008 年版)[M].南宁:广西科学技术出版社,2008:1. [15] 广西壮族自治区食品药品监督管理局.广西壮族自治区壮药质量标准 第二卷 (2011 年版)[M].南宁:广西科学技术出版社,2011:1. [16] 张青青,余胜民,苏青,等.壮药香花护乳凝胶剂的薄层色谱鉴别及急性毒性实验研究[J].中国民族民间医药,2016,25(18):8-9,12. (收稿日期:2018-01-17) (修回日期:2018-02-09;编辑:魏民)

图 2 2007-2016 年 CNKI 数据库中93位发文频次≥5篇的作者合作网络图

图 3 2007-2016 年 CNKI 数据库中62家发文频次≥2篇的机构合作网络图

图 4 2007-2016 年 CNKI数据库中壮药研究文献的71高频关键词(≥4次)共现网络图

图 5 2012-2016 年 CNKI数据库中壮药研究突现词时间分区图谱

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.