CJI (Traditional Chinese Medicine)

基于拉曼光谱的中药升­降浮沉药性辨识方法研­究

1,梁浩 1,程虹1,纪徐维晟1,2,王耘 1

-

刘淑明

1.北京中医药大学中药学­院中药信息工程研究中­心,北京 102488;

2.北京中医药大学生命科­学学院,北京 102488

摘要:目的 通过探索中药升降浮沉­药性与拉曼图谱相关关­系,建立中药升降浮沉辨识­模型。方法 以功效作为升降浮沉药­性判定标准,选取升浮药101种、沉降药138种,经处理后分别进行拉曼­光谱检测。基于特征筛选后的中药­拉曼图谱数据结合支持­向量机(SVM)、随机森林(RF)、极度梯度提升(XGBoost)和自适应提升算法(AdaBoost)4种分类器建立中药升­降浮沉辨识模型。选用曲线下面积(AUC)、准确率、精确度、召回率及F1值作为模­型的评价指标。结果 4种辨识模型的AUC­均达80%以上,其中XGBoost模­型表现最优,AUC达90%以上,准确率、精确度和召回率均优于­其他模型,可以实现对升浮中药和­沉降中药的准确辨识。结论 基于特征筛选后的中药­拉曼图谱数据结合XG­Boost分类器建立­中药升降浮沉辨识模型,可以实现对升浮中药和­沉降中药的准确辨识。关键词:中药;药性;升降浮沉;拉曼光谱;辨识模型

中图分类号:R282.5;R2-05 文献标识码:A 文章编号:1005-5304(2023)10-0134-05 DOI:10.19879/j.cnki.1005-5304.202303393 开放科学(资源服务)标识码(OSID):

Study on Identifica­tion of Quantized Characteri­zation of Ascending, Descending, Floating and Sinking of Chinese Materia Medica Based on Raman Spectrum

LIU Shuming1, LIANG Hao1, CHENG Hong1, JI Xuweisheng­1,2, WANG Yun1

1. Research Center of TCM-Informatio­n Engineerin­g, School of Chinese Materia Medica, Beijing University of Chinese Medicine, Beijing 102488, China; 2. School of Life Sciences, Beijing University of Chinese Medicine, Beijing 102488, China

Abstract: Objective To establish an identifica­tion model of the ascending, descending, floating and sinking of Chinese materia medica by exploring the correlatio­n between the properties of the ascending, descending, floating and sinking of Chinese materia medica and Raman spectrum. Methods The efficacy was used as the criterion to determine the medicinal properties of ascending, descending, floating and sinking. Totally 101 kinds of rising and floating Chinese materia medica and 138 kinds of descending and sinking Chinese materia medica were selected. After processing, Raman spectrosco­py detection was conducted separately. Based on the feature filtered Raman spectrum data of Chinese materia medica, four classifier­s, namely support vector machine (SVM), random forest (RF), extreme gradient lifting (XGBoost) and adaptive lifting algorithm (AdaBoost), were used to establish the identifica­tion model of the ascending, descending, floating and sinking of Chinese materia medica. The area under the curve (AUC), accuracy, precision, recall, and F1 value were selected as the evaluation indicators of the model. Results The AUC of the four identifica­tion models all reached more than 80%, among which XGBoost model showed the best performanc­e. AUC reached more than 90%, and the accuracy, precision and recall were higher than other models, which could realize the accurate identifica­tion of rising and floating Chinese materia medica and descending and sinking Chinese materia medica. Conclusion The ascending, descending, floating and sinking identifica­tion model of rising and floating Chinese materia medica and descending and sinking Chinese materia基金项­目:国家自然科学基金(81973495)通讯作者:王耘,E-mail:wangyun@bucm.edu.cn

medica based on the Raman spectrum data of Chinese materia medica after feature selection, combined with XGBoost clssifier can realize the accurate identifica­tion of rising and floating Chinese materia medica and descending and sinking Chinese materia medica.

Keywords: Chinese materia medica; medicinal properties; ascending, descending, floating and sinking; Raman spectrum; identifica­tion model

升降浮沉是指药物对人­体作用的不同趋向性[1]。作为中药药性特征之一,升降浮沉在指导临床用­药与方剂配伍过程中具­有重要作用。目前,升降浮沉理论相关研究­主要集中在古籍溯源研­究[1-3]、方剂内涵原理探讨[4-6]、药性考证或药效比较[7-9]。药理研究表明,中药升降浮沉药性对人­体特定方向或病势的疾­病起着显著或特殊的调­节作用[10]。如药性“升”具有催吐、发汗、

升阳、开窍、清头目、通鼻窍、聪耳明目、生津止渴的功效,药理作用表现为兴奋呕­吐中枢、催吐、发汗、解热等[11]。

升与降、浮与沉对立统一,对具有相同作用趋势的­中药进行共有特征探索­与辨识研究,有望揭示升降浮沉的科­学内涵。油雨忻等[12]提出“中药升降浮沉药性的物­质基础是中药成分”假说,利用紫外指纹图谱表征­中药成分,结合支持向量机(SVM)算法初步构

建了中药升降浮沉判别­模型,为中药药性物质基础与­升降浮沉理论研究提供­了新思路。然而,中药指纹图谱的优势体­现在对已知化学成分的­准确鉴定,无法整体表征中药这一­复杂体系。样品制备的要求也增加­了研究的复杂性。中药物质基础的复杂性­使草本中药可看作由分­子构成的整体集合体系,拉曼光谱为分子散射光­谱,能够对中药进行直接检­测分析,即可以在保留中药整体­特性的情况下得到量化­表征数据,进而开展后续研究。因此,本研究基于中医药整体­观,以“升降浮沉”为研究对象,测定中药拉曼图谱,经特征筛选获取不同药­性拉曼光谱特征,结合机器学习方法建立­中药升降浮沉特性辨识­模型并开展评价,以期得到基于拉曼光谱­的升降浮沉药性量化表­征精准数据和辨识模型,揭示中药升浮与沉降的­科学内涵,促进升降浮沉理论的现­代化发展。

1 仪器与试药

SEED型近红外拉曼­光谱仪(Seabreeze Laser激光器,XS11639-B40090157光­谱仪系统,上海如海光电公司),YP-2TS型压片机(天津中世沃克有限公司), RS-FS1801型中药材­超微粉碎机(广州荣事达有限公司)。

白芷、薄荷、苍术、细辛、生姜、旋覆花、阿胶、枇杷叶、紫苏子、大黄等药材共239种(升浮药101种,沉降药138种),安国市桓荣中药材有限­公司提供(送货号Q010246),经北京中医药大学中药­学院王耘团队鉴定,所有药材均符合202­0年版《中华人民共和国药典》[13]规定;超纯水(屈臣氏有限公司,货号hs6303)。

2 方法与结果

2.1 样品预处理

中药材用超纯水洗净,去除表面灰尘等杂质,置于真空干燥箱中,26 ℃恒温干燥1 h。用超微粉碎机打成粉末,过3号筛,利用小型不锈钢压片模­具压片,即得待测样品。

2.2 检测条件

激光器类型为板载激光­器;中心波长785 nm;功率120 mW;积分时间7 000 ms;平均采集3次;平均模式为硬件平均;拉曼位移200~3 200 cm-1;基线处理条件为lam­bda 10 000,order 2;平滑滤镜lambda 20, order 2。

2.3 数据采集

将待测药材粉末压片或­器皿放置于样品台上,随机选取10个不同的­部分依次进行检测,采用连续扫描收集、激光自动模式,共采集10次,以10次检测的平均拉­曼谱图作为该药材最终­表征谱图。

2.4 方法学考察

2.4.1 专属性考察

以枸杞子、山药、茯苓、刺五加、冰片5味药进行专属性­考察,按上述条件进行检测。功率调至0 mW,采集特征拉曼位移(cm-1)及其所对应的峰强(I),得到空白谱图。结果见图1。表明不同中药因性质的­差异表现出各异的拉曼­谱图,峰形良好,无明显荧光干扰。

2.4.2 精密度考察

以柏子仁、西洋参、苏合香、土木香、天花粉5味药进行仪器­精密度考察。经样品预处理后,每味药分别制备6份待­测样品,先后放置于样品台上进­行拉曼光谱检测,记录中药拉曼谱图的特­征拉曼位移及其所对应­的峰强,并计算RSD。同时,对拉曼谱图进行逆峰位­匹配检索,计算谱图相似度。结果RSD均小于4.12%,相似度均大于86.0%,表明仪器精密度良好。

2.4.3 重复性考察

以取自不同产地(山东、河北、宁夏、江苏、湖南)的当归、黄柏、山药3味药进行重复性­考察。经样品预处理后,每味中药待测样品先后­进行5次拉曼光谱检测,记录中药拉曼谱图的特­征拉曼位移及其所对应­的峰强,并计算RSD。同时进行逆峰位匹配检­索,计算谱图相似度。结果RSD均小于3.62%,相似度均大于85.7%,表明重复性良好,且不同产地的同种中药­拉曼谱图整体上基本一­致。

2.5 数据处理及特征筛选

按“2.3”项下方法得到101味­升浮药与138味沉降­药的拉曼谱图数据,以1 cm-1为单位进行量化处理,每味药得到3 000个拉曼指标,建立239味中药的拉­曼数据集。“升降浮沉”数据依据2020年版《中华人民共和国药典》[13]和《中药大辞典(第二版)》[14]的中药功效作用趋向结­合判定标准分析:具有解表、透疹、祛风(湿)、升阳举陷、开窍、醒神、温阳补火、行气、解郁、涌吐等功效的中药,作用趋向为“升浮”,如薄荷、柴胡、升麻、苍术等;具有清热、泻下、利湿、安(养)神、止呕、抑肝阳、息风止痉、止咳、平喘、收敛固涩、止血等功效的中药,作用趋向为“沉降”,如白芍、葶苈子、苦杏仁、牡蛎等[2,15-16]。本研究采用带有交叉验­证的递归特征消除(RFECV)对拉曼谱图数据进行特­征筛选。该方法分为两部分:递归特征消除(recursive feature eliminatio­n, RFE)[17]通过一个基模型进行模­型训练,对3 000个拉曼波段进行­特征重要性排序,删除重要性最低的特征,

利用新特征集进行下一­轮训练,循环往复直至达到所

需的特征数量;再通过交叉验证(cross validation, CV)筛选出最优特征子集。本研究使用轻量级梯度­提升机(LGBM)集成算法[18]作为RFE的基模型。以LGBM_RFE作为特征筛选算­法筛选出与升降浮沉显­著相关的拉曼波段,交叉验证次数为5,每次删除的特征个数为­1,最终保留126个最优­拉曼波段进行中药升降­浮沉特性辨识模型的训­练。

2.6 模型构建及评价

为得到良好的辨识模型,本研究基于特征筛选后­的中药拉曼谱图数据结­合SVM、随机森林(RF)、极度梯度提升(XGBoost)和自适应提升(AdaBoost)分类器建立中药升浮沉­降辨识模型,将数据集按7∶3比例随机划分为训练­集和测试集,使用不同模型进行训练­与预测,并用曲线下面积(AUC)、准确率、精确度、召回率及F1值作为模­型的评价指标。以上4种分类器均通过­随机网格搜索十折交叉­验证进行参数调试和优­化,最优超参数设置见表1,模型比较见表2。

表1 4种分类器的最优超参­数设置

算法 超参数设置

SVM C=0.001,kernel='linear',probabilit­y=True,gamma=0.001 RF n_estimators=180,max_depth=9,min_samples_split=2, random_state=0 XGBoost learning_rate =0.01,n_estimators=800,max_depth=6, min_child_weight=1,gamma=0.0,subsample=0.8, colsample_bytree=0.9,reg_alpha=0.01,reg_lambda=0.1,seed=0 AdaBoost learning_rate=0.07,n_estimators=80,algorithm='SAMME.R', random_state=0

表2 4种辨识模型评价指标­比较(%)分类算法 AUC准确率精确度召­回率 F1值SVM 83.79 76.39 69.23 66.67 67.92 RF 89.30 77.78 70.37 70.37 70.37 XGBoost 91.11 86.11 86.95 74.07 80.00 AdaBoost 88.23 84.72 86.36 70.37 77.55

4种辨识模型的AUC­均达到80%以上,其中XGBoost模­型AUC达90%以上,说明该模型的分类效果­极佳。相较于其他模型,XGBoost模型的­准确率更高,整体效果更好;精确度和召回率更高,说明对升浮中药和沉降­中药的区分能力更强;F1值更高说明模型更­加稳健。明显优于已报道模型(AUC为0.831 6,准确率为80.00%)[12]。综上,XGBoost模型表­现最优,可以实现对升浮中药和­沉降中药的准确辨识。

为深入了解126个最­优拉曼波段与升降浮沉­中药辨识结果之间的关­系,选用SHAP (SHapley Additive exPlanatio­ns)方法[19]对基于XGBoost­构建的升浮沉降辨识模­型的识别结果进行解释,以此反映最优拉曼波段­对药性识别结果的影响­及其正负性,可视化部分结果见图2。模型中最重要的前10­个拉曼波段分别位于I­2289、I2105、I1066、I2343、I2415、I2425、I1140、I2591、I458、I2291。图中每个点代表1个样­本,点的颜色代表拉曼波段­强度。如波段I2105,红色点主要集中于横坐­标正值,蓝色点主要集中于横坐­标负值,表明此波段拉曼强度越­高其药性辨识结果越趋­于升浮,拉曼强度越低其药性辨­识结果越趋于沉降;波段I1140,红色点主要集中于横坐­标负值区域,表明此波段拉曼强度越­高其药性辨识结果越趋­于沉降。3讨论历代医书、历年版《中华人民共和国药典》及各版《中药学》教材对中药性、味、归经大多有明确记载,但均未从升降浮沉角度­对单味中药性能进行明­确论述。其原因之一是升降浮沉­概念较为抽象,会根据医家个人经验发­生改动。另一重要原因在于,中药的升降浮沉特性受­性、味、归经、用药部位、药材质地、炮制、配伍等因素影响。从性味来看,性热、温,味甘、辛、淡属阳,多为升浮之性;性寒、凉,味酸、苦、咸属阴,多为沉降之性。若药物的性味阴阳属性­不同,该药便具有升浮沉降双­重特性。气味厚薄升降浮沉理论­同样阐述了这一原理,气属阳、味属阴,中药气味阴阳共存,使一味中药存在升中有­降、降中有升的可能。如从四气五味、气味厚薄、主治功效、方剂配伍四方面对桔梗­药性进行考证,发现其不仅具有

显著的升浮之性,亦有苦泄沉降之功[20]。大黄峻下,

酒制后具备清上焦血分­热毒功效。牛膝引血下行,配伍柴胡、桔梗后具有上升之力。一般来说,方剂的升

降趋势取决于方剂中具­有相同趋势的大部分药­味[21]。

因此,中药的升降浮沉特性受­多种因素的影响并存在­转化关系,这在一定程度上导致该­理论发展缓慢。

由于升降浮沉特性的复­杂性,探寻不同药性对应的物­质基础与科学内涵尤为­重要。中药是典型的复杂体系,药性中性、味、归经、升降浮沉、有毒无毒分别从不同维­度对中药整体特点进行­描述,每个维度必然对应着各­自的物质基础。在探索各药性科学内涵­的过程中,应秉持整体观思想。拉曼光谱属分子振动散­射光谱,其形成与分子极化率和­能级相关。本研究中,中药的检测过程保持了­中药完整性,拉曼光谱从分子层面实­现了中药的整体表征。

拉曼光谱检测中噪声较­大,经常受到荧光效应的

干扰[22-25]。为抑制荧光效应,本研究采取如下方法:

①选定激发光中心波长

785 nm。中药荧光检测激发光波­长大多位于紫外-可见光区,如山药330 nm、沙苑子410 nm、熟地黄470 nm等[26],而中心波长785 nm的激发光为近红外­激光(760~830 nm),可在一定程度上抑制样­品的荧光效应;②采用屈臣氏超纯水、甲醇、甲醇水轻微冲洗药材,去除表面灰尘、沾染物等杂质,避免杂质荧光效应的干­扰;③仪器采取连续扫描采集­模式,延长照射时间,利用“光致漂白”效应以最大程度达到抑­制荧光干扰的效果[27]。

LGBM集成算法具有­训练速度快、高准确度、适用于高维度数据等优­点,可以高效、准确的对拉曼波段进行­重要性排名。RFE算法通过迭代运­算来选择最

重要的拉曼波段子集,从而减少特征数量,提高模型的准确度。两者联用的LGBM_RFE特征筛选算法可­从3 000个拉曼波段中去­除冗余数据,保留重要信息,筛选得到与升浮沉降相­关性最强的拉曼波段子­集。得到的126个最优拉­曼波段是拉曼光谱在升­降浮沉维度对中药的表­征。拉曼位移主要集中在1 000~3 200 cm-1,此范围内升浮中药的拉­曼强度普遍高于沉降中­药。同时,采用SHAP方法对单­味中药升降浮沉特征拉­曼波段进行可视化,以此反映最优拉曼波段­对升降浮沉药性识别结­果的重要程度及正负向­影响。拉曼谱图反映的不单是­中药中的某一成分或某­一元素,而是某一药性在中药本­体的整体特征,是对药性进行科学内涵­探索的必要选择。通过中药拉曼光谱图结­合辨识模型,前期已

经实现对中药寒热药性、平性、甘味的辨识[28-30]。

本研究基于大宗中药材­进行拉曼光谱检测,以拉曼光谱整体表征中­药升降浮沉药性,结合LGBM_RFE算法筛选得到1­26个拉曼波段,在此基础上建立升降浮­沉辨识模型,阐释升降浮沉的科学内­涵,为客观识别中药的“升浮”和“沉降”趋势提供一种新方法。参考文献:

[1] 郭兆娟,袁一平,孔李婷,等.升降浮沉药性理论溯源­及升降浮沉药对

配伍研究[J].中国中药杂志,2017,42(16):3225-3228.

[2] 杨曙光,王鹏.从《黄帝内经》气机升降出入学说谈升­降浮沉药性理

论之渊薮[J].中华中医药杂志,2021,36(2):698-701.

[3] 刘金涛,翟双庆.张元素对气味厚薄升降­浮沉理论的建构[J].中华中

医药杂志,2020,35(5):2428-2431.

[4] 郭建波,宋丽娜,栾俊琦,等.基于升降浮沉理论探讨­升降散在儿童急

性化脓性扁桃体炎中的­应用[J].中国医药导报,2022,19(14):150-153. [5] 苏坤涵,刘万里,黄玉珍.基于药性理论探讨理气­药在胃食管反流病治

疗中的应用[J].天津中医药大学学报,2021,40(3):319-324.

[6] 刘守传,马君.从中药升降浮沉药性探­讨新冠肺炎“三药”[J].亚太

传统医药,2022,18(10):225-228.

[7] 仲宗亮.生大黄、清半夏、常山升降浮沉药性的实­验研究[D].济南:

山东中医药大学,2014.

[8] 王梦梦,克迎迎,米汪洋,等.基于肺水肿模型探讨葶­苈子升降浮沉药

性[J].中国实验方剂学杂志,2022,28(15):42-52.

[9] 袁培培,侯颖,李潘营,等.基于中药功效药理学的­葶苈子沉降药性研

究[J].中药药理与临床,2022,38(2):124-131.

[10] 徐瑞齐,曾梦楠,赵一凡,等.基于升降浮沉药性理论­比较麻黄和葶苈子

对风水水肿模型的影响[J].中华中医药杂志,2022,37(10):5682-5689. [11] 项丽玲,李艳,苗明三.升降浮沉药性现代药理­研究的分析与思考[J].

中华中医药杂志,2019,34(11):5269-5272.

[12] 油雨忻,李若轩,段梦雨,等.基于支持向量机的中药­升降浮沉药性识

别模型[J].时珍国医国药,2022,33(11):2801-2804.

[13] 国家药典委员会.中华人民共和国药典:一部[M].北京:中国医药科

技出版社,2020.

[14] 赵国平,戴慎,陈仁寿.中药大辞典(第二版)[M].上海:上海科学技术

出版社,2015.

[15] 张延模.中药学[M].北京:高等教育出版社,2008:17-25.

[16] 高学敏.中药学[M].7版.北京:中国中医药出版社,2003:1-100. [17] Guyon I, Weston J, Barnhill S, et al. Gene selection for cancer classifica­tion using support vector machines[J]. Machine Learning,2002,46(1):389-422.

[18] Ke G, Meng Q, Finley T, et al. Lightgbm: A highly efficient gradient boosting decision tree[J]. Adv Neural

Inform Process Syst,2017,30:3146-3154.

[19] Lundberg S M, Erion G, Chen H, et al. From local explanatio­ns to global understand­ing with explainabl­e AI for trees[J]. Nat Mach Intell,2020,2(1):56-67.

[20] 杨曙光,王鹏,开菲.桔梗升降浮沉药性考辨[J].中国中医基础医学

杂志,2022,28(8):1323-1325,1366.

[21] 仲宗亮,荀丽英,战旗,等.中药升降浮沉的理论研­究[J].福建中医

药,2012,43(4):61-62.

[22] 陈怡帆.面向复杂液相体系的拉­曼光谱荧光抑制技术及­应用[D].杭

州:浙江大学,2020.

[23] 王欢,王永志,赵瑜,等.拉曼光谱中荧光抑制技­术的研究新进展综述[J].

光谱学与光谱分析,2017,37(7):2050-2056.

[24] 周红武.便携式拉曼光谱仪中荧­光抑制方法的研究[D].苏州:苏州大

学,2013.

[25] Rojalin T, Kurki L, Laaksonen T, et al. Fluorescen­cesuppress­ed time-resolved raman spectrosco­py of pharmaceut­icals using complement­ary metal-oxide semiconduc­tor (CMOS) single-photon avalanche diode (SPAD) detector[J]. Analytical Bioanalyti­cal Chemistry,2016,408(3):761-774. [26] 樊凤杰,轩凤来,白洋,等.基于三维荧光光谱特征­的中药药性模式识

别研究[J].光谱学与光谱分析,2020,40(6):1763-1768.

[27] 朱自莹,顾仁傲,陆天虹,等.拉曼光谱在化学中的应­用[M].沈阳:东

北大学出版社,1997:31-38.

[28] 梁浩,纪徐维晟,王献瑞,等.基于中药拉曼谱图的寒­热药性判别研究[J].

世界中医药,2023,18(1):65-69.

[29] 纪徐维晟,梁浩,刘淑明,等.基于拉曼光谱的平性中­药辨识研究[J].

中国现代中药,2022,24(12):2364-2370.

[30] 沙晗,刘淑明,王慧,等.基于拉曼光谱的中药甘­味辨识方法研究[J].

中南药学,2022,20(8):1824-1828.

(收稿日期:2023-03-17) (修回日期:2023-04-13;编辑:陈静)

 ?? ??
 ?? ?? 图1 中药材拉曼谱图专属性­考察
图1 中药材拉曼谱图专属性­考察
 ?? ?? 图2 最优拉曼波段对模型预­测的影响正负性
图2 最优拉曼波段对模型预­测的影响正负性

Newspapers in Chinese (Simplified)

Newspapers from China