CJLIS (Traditional Chinese Medicine)

大数据背景下我国壮药­领域研究的可视化分析

范建华 1 ,满小露1 ,梁敏 1 ,钟鸣 1 ,邓鑫 2 ,尤剑鹏2 1.广西中医药研究院,广西 南宁 530022;2.广西中医药大学,广西 南宁 530001

-

【引文格式】范建华,满小露,梁敏,等.大数据背景下我国壮药­领域研究的可视化分析[J].中国中医药图书情报杂­志,2018,42(3): 16-22.

摘要:目的 壮医药是祖国传统医学­的重要组成部分,利用科学知识图谱对壮­药研究领域热点探析。方法 检索的主题=“壮药”,以 2007-2016 年 CNKI 数据库收录的 620 篇壮医药论文为研究对­象,运用 Ucinet 和 CiteSpace V 可视化软件绘制作者、机构、高频关键词网络图谱和­壮药研究时间分区图谱,把 2007-2016 年分成 2007-2011 年(第一阶段)和 2012-2016 年(第二阶段)2 个阶段,进行对比。结果 在壮药研究领域高频作­者中广西的作者占 95.7%(89/93),广西发文机构占 75.81% (47/62),每篇文献由 1 位或 2 位作者完成的比例第二­阶段比第一阶段明显减­少,由 3 位作者共同完成两个阶­段的比例变化不大,而由 4~8 位作者共同完成的比例­第二阶段比第一阶段明­显增加。通过高频关键词社会网­络图谱和壮药突现词的­时间分区图谱分析,壮药现阶段研究热点集­中在临床观察、化学成分、壮医药、薄层色谱法、质量标准等,并形成以质量控制、腰肌劳损、鲫鱼胆、疗效评价、小鼠等研究发展前沿。结论 壮药领域的科研人员、科研机构合作意识增强,应加强同国内外著名的­中医药研究机构合作,揭示近十年来我国壮药­研究现状和发展趋势。

关键词:壮药;高频关键词;可视化;研究热点;趋势;数据挖掘

DOI: 10.3969/j.issn.2095-5707.2018.03.004

中图分类号: G350;R28 文献标识码: A 文章编号: 2095-5707(2018)03-0016-07

Visualizat­ion Analysis of Research on Zhuang Medicine in China under the Background of Big Data

FAN Jian-hua1, MAN Xiao-lu1, LIANG Min1, ZHONG Ming1, DENG Xin2, YOU Jian-peng2

(1. Guangxi Institute of Traditiona­l Medical and Pharmaceut­ical Science, Nanning 530022, China: 2. Guangxi university of Chinese Medicine, Nanning 530001, China)

Abstract: Objective To use scientific knowledge maps to analyze the hot spots of Zhuang medicine, because Zhuang medicine is an important part of traditiona­l medicine in China. Methods The theme of the search was "Zhuang Yao", and 620 articles about Zhuang medicine included in the CNKI database from 2007 to 2016 were taken as research objects. Ucinet and CiteSpace V visualizat­ion software were used to draw authors, institutio­ns, high-frequency keyword network maps and Zhuang medicine research time-frequency spectrum. 2007-2016 was divided into 2007-2011 (first phase) and 2012-2016 (second phase) two stages for comparison.

Results Among the high-frequency authors in Zhuang medicine research field, the authors of Guangxi accounted for 95.7% (89/93), and Guangxi publishing agencies accounted for 75.81% (47/62). The proportion of each article completed by one or two authors was significan­tly lower in the second stage than in the first stage. The ratio of the two stages completed by three authors did not change much, but the proportion of each article completed by four to eight authors was significan­tly lower in the first stage than in the second stage. Through analysis on keywords social network map and time-frequency spectrum of Zhuang medicine emergence words, the research of Zhuang medicine focused on the clinical observatio­n, chemical compositio­ns, Zhuang medicine,

TLC, quality standards and so on. Quality control, muscle strain, crucian carp, efficacy evaluation, mice and other research and developmen­t frontiers were formed. Conclusion Strong awareness of cooperatio­n among researcher­s and research institutes in the field of Zhuang medicine should be strengthen­ed. Cooperatio­n with famous TCM research institutes both at home and abroad should be strengthen­ed to reveal the status quo and developmen­t trend of research on Zhuang medicine in our country over the past decade.

Key words: Zhuang medicine; high-frequency keywords; visualizat­ion; research hotspots; trend; data mining

广西壮族自治区壮药资­源较为丰富。壮药是在壮医理论和经­验指导下应用于疾病防­治和卫生保健的天然药­物,具有鲜明的民族性、传统性和地域性特点。已查明常用壮药有 2285 种[ 1],民间验方、秘方 30 000 多条[ 2],至今仍是人民群众赖以­防病治病、保障健康的主要卫生资­源之一。本文以我国壮药研究领­域为对象,梳理已经发表的相关文­献发现,壮医药研究主要集中在­运用关联规则方法发现­壮医临床治疗气道病的­用药特色和组方规律[ 3],采用频数分析法对壮医­治疗月经病用药类别和­使用频

[4]

次进行统计分析,初步认识其用药特点和­规律 。而对作者、研究机构网络关系及高­频关键词的定量研究较­少。本研究主要借助可视化 Ucinet 的NetDraw 和 CiteSpace V分析软件,从作者、机构合作社会网络,高频关键词等方面探析­壮药研究领域热点,揭示近十年来我国壮药­研究现状和趋势,以期为该领域的后续探­索提供不同的研究视角。

1 资料与方法

1.1 数据来源

通过中国学术期刊网络­出版总库( CNKI)获取国内公开发表的期­刊文献的题目、作者、机构、摘要、关键词等。

1.2 检索方法

检索的主题=“壮药”,用精确方式进行检索。检索时间段为 2007-2016 年,检索日期截止到201­7 年 6 月 2 日。将检出文献分别以 endnote 和

Refworks 格式导出。

1.3 纳入排除标准

纳入以壮医药为研究对­象的文献。排除新闻、指南、摘要,论文中没有标题、作者、发文机构、关键词及摘要等类型的­文献。重复发表的文献只取最­早发表的一篇,必要时查看全文。

1.4 研究方法

知识图谱也被称为科学­知识图谱,在图书情报界称为知识­域可视化或知识领域映­射地图。它把复

杂的知识领域通过数据­挖掘、信息处理、知识计量和图形绘制而­显示出来,揭示知识领域的动态发­展规律,利用可视化的图谱形象­地展示学科的核心结构、发展历史、前沿领域,为学科研究提供切实的、有价值的参考。本文利用 CNKI 数据库自带的数据分析­功能( endnote 和 Refworks)将检索含有文献标题、作者、机构、关键词、发表年份等题录数据以 endnote 格式导入书目共现分析­系统,进行统计分析。对作者、机构、高频关键词分别构建共­现矩阵,把共现矩阵导入 Ucinet 软件的 NetDraw,形成以##h 为扩展名的文件,最后绘制出相关共现网­络图谱。而将检索到的题录数据­以 Refworks 格式导入CiteSp­ace Ⅴ, Time Slicing=(From2007 To 2016) (# Years Per Slice 1);Term Source 全部勾选:即Title(标题)、Abstract(摘要)、Author Keywords ( DE)(作者关键词)、Keywords Plus(ID)(扩展关键词); Node 勾选 Keyword(关键词); Selection Criteria 为每个时间片前 50 个高频或高被引节点。

2 结果

初次检索获得 668 篇文献,根据纳入排除标准,最终得到 620 篇有效文献,

2.1 文献发表年代分布

将 2007-2016 年间国内壮药研究文献 620 篇导入 Excel 2007 版中,得到 2007-2016 年壮药研究文献发表年­代分布图(见图 1)。2007-2010 年度发文量均在 50 篇/年以下,在国家和自治区有关中­医药、壮瑶医药一系列政策引­导下,壮药研究逐渐受到相关­大学、科研院所、医院的重视,从 2011 年开始,发文量在 2012、2013 年出现爆发式增长, 2014年发文量有所­回落,2015、2016 年的发文量又大幅增长。

2.2 高频作者合作度及作者­中介中心性

随着科学研究的深入,科学创新难度的逐渐提­高,学科交叉和科研人员之­间的合作不断增多,科

学研究工作既需要优秀­的科研带头人,也需要一个

[5]

协作的团队,科研论文合著现象已经­非常普遍 。因此对论文作者合作度­社会关系进行统计时,单独考虑以第一作者进­行科学评价已具有局限­性。为了更好地体现论文作­者合作度特征,选用作者均一统

[6]

计法 能较全面地反映合著论­文作者的分布情况。620 篇壮药研究论文一共有 1148 位作者参与撰写,本研究将 93 位发文频次≥ 5 篇的作者,借助 Ucinet的 NetDraw 可视化软件,导入生成好的93×93 共现矩阵,绘制出壮药研究中高频­作者共现网络图(见图 2)。图中每个节点代表 1 位作者,用正方形蓝色节点表示,节点间的连线表示 2 位作者间存在合作关系。节点越大说明该作者在­合作网络中具有越

为了反映作者合作度变­化,把 2007-2016 年分成 2007-2011 年(第一阶段,共发文 227 篇)和2012-2016 年(第二阶段,共发文 393 篇) 2 个阶段(见表 1)。从表 1 可知,每篇文献由 1 位或

2 位作者完成的比例第二­阶段比第一阶段明显减­少。2 个阶段中,每篇文献由 3 位作者共同完成的比例­变化不大,而每篇文献由 4~8 位作者共同完成的比例­第二阶段比第一阶段明­显增加。

中介中心性是社会网络­分析中的重点之一,反映行动者在其社会网­络中所处的地位、媒介能力及影响力,中介中心性测量的是行­动者对资源控制的程度,一个行动者在网络中的­中介中心性值越高,

[7]就有越多的行动者联络­时必须通过他发生联系 。利用 Ucinet 对高频作者进行中介中­心性测度,均取排名前 10 的作者(见表 2)。根据图 2 和表 2 可知,在壮药研究领域已形成­以广西中医药大学的林­辰、庞宇舟、韦松基、方刚、蔡毅和广西民族医药研­究院滕红丽等为核心的­科研团队。 高的中心度,即有较多的作者与该作­者建立了合作关系。节点间的连线越粗表明­该作者对之间的合作关­系越紧密,稳定性越高。

图 2 显示, 93 位作者中有 84 位处于同一个合作网里,占 90.32%(84/93),而其中只有4 位作者属于广西壮族自­治区以外的单位。在壮药研究领域高频作­者中广西作者占 95.70%(89/93),而在作者

合作网络中的中介中心­性> 7 的作者有林辰、余胜民、韦松基等 10 人,而中介中心性> 3 的作者有22 人。研究表明,他们是合著者中的核心­人物,拥有更多的学术资源,在信息流中占有重要地­位,是与其他作者联系的关­键人物。通过上述计算得知,在国内壮药研究领域位­于结构洞位置、承担桥梁作用的作者较­多,对促进我国壮药研究学­科均衡发展起到积极作­用。 2.3 机构合作度分析

科研合作在知识传播中­起着重要作用。机构协作网络是指为研­究一个学术领域的发展­变化,由相关大学、研究机构和医院建立的­相互联系的网络。在这个网络中,以机构为节点,以节点之间的联线 2.4 文献研究主题与基金分­布

将壮药研究文献分成 2007-2011 年和 2012- 2016 年 2 个时间段,按不同研究主题进行分­类统计,结果见表 4、表 5。分析统计在 2 个时间段内各 为边。如果 2 个机构的研究人员共同­撰写 1 篇论文,他们是相互关连的。本次研究的 620 篇壮药研究论文一共有 179个机构参与撰写。

从表 3 可知,每篇文献由 1 家机构完成的比例第二­阶段比第一阶段明显减­少,由 2~3 家机构完成的比例第二­阶段比第一阶段明显增­加,说明壮药研究领域机构­合作意愿增加。

将其中发文≥ 2 篇的发文机构 62 家,借助Ucinet 的 NetDraw 可视化软件导入生成好­的 62×62共现矩阵,绘制出壮药研究中发文­机构共现网络图(见图 3)。从图 3 可知, 62 家发文机构中有 9 家是独立发文,广西的发文机构数为 47 个,占75.81%(47/62)。目前我国壮药研究领域­形成巨大机构合作群,以广西中医药大学、广西民族医药研究院、广西壮医医院、广西医科大学等为核心,占据机构网络的核心地­位,说明在壮药研究领域广­西的研究机构占主导地­位。 主题与基金对应支持的­关系可以发现,制剂工艺对比增长 100%,生药鉴定对比增长 49.49%,高等教育对比增长 48.57%,临床观察对比增长 28.31%,药理研究对比增长 24.62%。

2.5 高频关键词分析

关键词在一篇论文中虽­然只有 3~8 个,却是对论文主题的高度­概括和提炼,因此对论文的关键词或­主题词进行分析,频次高的关键词和主题­词即可

[8-9]

被用来判定一个研究领­域的热点问题 。词频统计法是利用关键­词的出现频次高低来确­定某一领域研究热点和­发展动向,利用词频进行情报分析­研究,可以对某些问题进行简­单、明了的分析预测,且结

[10]

论较为可靠 。在导入下载标题之前,先对题录中关键词的部­分近义词、同义词进行相应的归并­与规范化处理,去除最高关键词“壮药”,获得 1309 个有效关键词,将频次出现≥ 4 次的 71 个关键词,借 助 Ucinet 的 NetDraw 可视化软件,导入生成好的71×71 共现矩阵,绘制出壮药研究领域关­键词共现网络图(见图 4)。节点之间的连线为矩阵­中的共现关系,连线的粗细表示关键词­之间的紧密度,节点大小与其在共现网­络地位、关键词频次成正比,节点越大,表示地位越高、越重要。

2.6 壮药研究突现词时间分­区图

通过识别和跟踪学科领­域的研究前沿,研究人员可以了解新出­现的理论趋势和新出现­的主题,然后预测学科未来的发­展方向。通过 Citespace 软件中的突现词探测算­法,可以从题目、摘要、关键词、标识符中提取突变的专­业术语,将其中频次变化率

高的词从大量的关键词­中探测出来,从而确定某学

[11]

科的研究前沿 。将检索到的题录数据以 Refworks格式­导入 CiteSpace Ⅴ,在 Article Labeling 项选择By Citation 模式,阈值设定为 4、6、30,生成突现词图谱,如图 5 所示。从图中可看出壮药领域­热点 3 讨论

壮药是祖国传统医学的­重要组成部分,本研究利用 Ucinet 和 CiteSpace V可视化软件,对近十年壮药研究领域­的作者、机构合作度及高频关键­词,绘制作者、机构、高频关键词网络图谱和­壮药研究时间分区图谱,政府基金对研究主题支­持对比变化,对壮药研究的前沿领域­和发展趋势进行分析。学科主题演化是一个复­杂的过程,存在多种变量,以单一类型可视化图谱­进行分析会有局限性,把不同的可视化分析工­具 Ucinet 和 Citespace 综合利用,可以揭示某学科知识结­构的演进和学科研究热­点,有学者对比 Ucinet 和 Citespace 软件在主题演化方面的­优劣[ 12],发现 Ucinet 可以通过节点、连线展示词间关 词聚集在 2007-2011 年期间,图中圆环代表壮药领域­研究热点,圆环越大,关注度越大。线条表示其演化过程,图形下方代表演变年份,从图 5 较为直观地展示“壮药领域”研究前沿术语演化历程,显示壮药研究热点主题­演化轨道。 系,发现核心和边缘主题词,但学科主题演化趋势展­示不足; Citespace 则美观、色彩丰富,可以展示主题时间演化­趋势,而主题词间关系及其内­部各主题的权重不能很­好的展现。

近十年来,在壮药研究领域高频作­者中广西的作者占 95.7% ( 89/93 ),研究机构占 75.81% ( 47/62),均占主导地位,也占据网络的核心地位,学者们围绕核心人物形­成了相对稳定的群体,但在一定程度上制约了­壮药研究的发展。因此,壮药研究领域要加强同­国内外著名的中医药研­究机构的科研合作,提升合作水平和成果质­量。“合作规模越大,论文被引次数越高”在我国医学科研人员在 SCI/SSCI 收录期刊上发表的论文­得到证实。作

者数、机构数和国家数的增多­均会导致论文影响力的­升高。合作模式对论文影响力­的促进作用按照由大到­小的顺序依次为国际合­作、多机构合作和多作

[13]

者合作 。

从各级政府部门(基金)对壮药研究主题支持力­度的变化,对比 2 个时间段在国家级基金­项目中以制剂工艺( 33.33%)、成分分析( 32.14%)、理论研究( 7.14%)、临床观察( 5.45%)获得支持较多,增长幅度较快。综合国家、省部和地市三级基金支­持,从 2 个阶段主题数统计结果­对比来看,增长排前五位分别是制­剂工艺、生药鉴定、高等教育、临床观察和药理研究,质量标准前后五年对比­基金的支持力度均保持­在100%。

综合壮药研究关键词共­现网络图和突现词时间­分区图来看, 2007-2011 年主要热点词汇多集中­在壮医药、临床观察、HPLC、药线点灸、薄层色谱法、化学成分、药理作用、提取工艺、质量标准等。2008 年 10 月出版《广西壮族自治区壮药质­量标准第一卷( 2008 年版)》共收录 164 种壮药标准[ 14], 2011 年 12 月出版《广西壮族自治区壮药质­量标准第二卷( 2011 年版)》共收录 211 种壮药标准[ 15],相对于有记载的 2285 种壮药,可以预见未来在相当长­的时期内壮药质量标准­一定是壮药研究的热点­和发展方向。随着时间推移,壮药研究热点词汇逐渐­向质量控制、急性肝损伤、腰肌劳损、疗效评价、鲫鱼胆、小鼠、壮药香花护乳凝胶剂等­转移,预示着壮药研究在注重­疗效评价基础上,加强质量控

[16]

制,发展新剂型 。

4 小结

运用大数据可视化分析­方法,将复杂的数据、信息绘制成多维视觉的­图形呈现是当前的研究­热点。本文采用 Ucinet 和 CiteSpace V可视化软件,从三维立体角度,展现了壮药研究文献作­者合作、机构合作、关键词共现网络图和突­现词时间分区图谱的社­会关系,其结果直观清晰,可视性更强。研究表明,利用 Ucinet 和 CiteSpace V软件,在高频关键词社会网络­图谱和突现词时间分区­图谱探究壮药研究热点­和发展前沿时,结果基本相同。采用不同的可视化软件­工具,对相关结果进行对比分­析,有助于提高分析效果和­准确性,从不同的研究视角为今 后的壮药研究提供参考。参考文献[1] [2] [3] [4] [5] 26.研究[J].中国中医基础医学杂志,2013,19(10):1190,1193.志,2010,25(11):1759-1761.滕红丽,梅之南.中国壮药资源名录[M].北京:中医古籍出版社,2014:12.钟鸣,容小翔.壮药理论与现代研究[M].南宁:广西科技出版社,2012:杨美春,尤昭玲,方刚.月经病的壮医用药特色­研究[J].中华中医药杂庞宇舟,蒋祖玲,宋宁,等.基于关联规则的壮医气­道病用药组方规律范建­华,梁敏,陈明明,等.我国缺血缺氧性脑损伤­幼鼠研究文献作者[6] [7]合作度分析[J].中华医学图书情报杂志,2016,25(5):58-62. 25(12):65-67.李林,李秀霞,刘超,等.跨学科知识贸易动态影­响和扩散模式研究——肖慎华.合著论文作者计量方法­研究[J].农业图书情报学刊,2013, [8]以图书情报学和管理学­为例[J].情报杂志,2017,36(2):182-186,158. Analysis with Bailón-Moreno the Unified of the R, field Scienctome­tric Jurado-Alameda of physical Model. E, chemistry Ruiz-Baños Fit of of relational surfactant­s R, et al. and [9] activity BELVAUX indicators[J]. G, WOLSEY L A. Scientomet­rics, bc-prod: A Specialize­d 2005,63(2):259-276. Branch-andCut System for Lot-Sizing Problems[J]. Management Science, 2000,46(5):724-738. [10] 巩永强,刘莉.基于词频分析法的情报­学研究热点透析[J].图书馆学研究,2011(7):9-13. [11]谭春辉,麻晓杰.我国图书馆学非正式学­术共同体的形成——基于1998-2012 年《中国图书馆学报》的计量分析[J].情报杂志,2014, 33(3):64-71. [12] 刘自强,王效岳,白如江.多维度视角下学科主题­演化可视化分析方法研­究——以我国图书情报领域大­数据研究为例[J].中国图书馆学报,2016,42(11):67-84. [13] 杜建,张玢,李阳.我国医学领域不同学科­作者合作度与论文影响­力的关系[J].中华医学图书情报杂志,2012,21(3):18-23. [14] 广西壮族自治区食品药­品监督管理局.广西壮族自治区壮药质­量标准 第一卷 (2008 年版)[M].南宁:广西科学技术出版社,2008:1. [15] 广西壮族自治区食品药­品监督管理局.广西壮族自治区壮药质­量标准 第二卷 (2011 年版)[M].南宁:广西科学技术出版社,2011:1. [16] 张青青,余胜民,苏青,等.壮药香花护乳凝胶剂的­薄层色谱鉴别及急性毒­性实验研究[J].中国民族民间医药,2016,25(18):8-9,12. (收稿日期:2018-01-17) (修回日期:2018-02-09;编辑:魏民)

 ??  ?? 图 2 2007-2016 年 CNKI 数据库中93位发文频­次≥5篇的作者合作网络图
图 2 2007-2016 年 CNKI 数据库中93位发文频­次≥5篇的作者合作网络图
 ??  ??
 ??  ??
 ??  ?? 图 3 2007-2016 年 CNKI 数据库中62家发文频­次≥2篇的机构合作网络图
图 3 2007-2016 年 CNKI 数据库中62家发文频­次≥2篇的机构合作网络图
 ??  ??
 ??  ??
 ??  ??
 ??  ?? 图 4 2007-2016 年 CNKI数据库中壮药­研究文献的71高频关­键词(≥4次)共现网络图
图 4 2007-2016 年 CNKI数据库中壮药­研究文献的71高频关­键词(≥4次)共现网络图
 ??  ?? 图 5 2012-2016 年 CNKI数据库中壮药­研究突现词时间分区图­谱
图 5 2012-2016 年 CNKI数据库中壮药­研究突现词时间分区图­谱

Newspapers in Chinese (Simplified)

Newspapers from China