CJI (Traditional Chinese Medicine)
基于拉曼光谱的中药升降浮沉药性辨识方法研究
1,梁浩 1,程虹1,纪徐维晟1,2,王耘 1
刘淑明
1.北京中医药大学中药学院中药信息工程研究中心,北京 102488;
2.北京中医药大学生命科学学院,北京 102488
摘要:目的 通过探索中药升降浮沉药性与拉曼图谱相关关系,建立中药升降浮沉辨识模型。方法 以功效作为升降浮沉药性判定标准,选取升浮药101种、沉降药138种,经处理后分别进行拉曼光谱检测。基于特征筛选后的中药拉曼图谱数据结合支持向量机(SVM)、随机森林(RF)、极度梯度提升(XGBoost)和自适应提升算法(AdaBoost)4种分类器建立中药升降浮沉辨识模型。选用曲线下面积(AUC)、准确率、精确度、召回率及F1值作为模型的评价指标。结果 4种辨识模型的AUC均达80%以上,其中XGBoost模型表现最优,AUC达90%以上,准确率、精确度和召回率均优于其他模型,可以实现对升浮中药和沉降中药的准确辨识。结论 基于特征筛选后的中药拉曼图谱数据结合XGBoost分类器建立中药升降浮沉辨识模型,可以实现对升浮中药和沉降中药的准确辨识。关键词:中药;药性;升降浮沉;拉曼光谱;辨识模型
中图分类号:R282.5;R2-05 文献标识码:A 文章编号:1005-5304(2023)10-0134-05 DOI:10.19879/j.cnki.1005-5304.202303393 开放科学(资源服务)标识码(OSID):
Study on Identification of Quantized Characterization of Ascending, Descending, Floating and Sinking of Chinese Materia Medica Based on Raman Spectrum
LIU Shuming1, LIANG Hao1, CHENG Hong1, JI Xuweisheng1,2, WANG Yun1
1. Research Center of TCM-Information Engineering, School of Chinese Materia Medica, Beijing University of Chinese Medicine, Beijing 102488, China; 2. School of Life Sciences, Beijing University of Chinese Medicine, Beijing 102488, China
Abstract: Objective To establish an identification model of the ascending, descending, floating and sinking of Chinese materia medica by exploring the correlation between the properties of the ascending, descending, floating and sinking of Chinese materia medica and Raman spectrum. Methods The efficacy was used as the criterion to determine the medicinal properties of ascending, descending, floating and sinking. Totally 101 kinds of rising and floating Chinese materia medica and 138 kinds of descending and sinking Chinese materia medica were selected. After processing, Raman spectroscopy detection was conducted separately. Based on the feature filtered Raman spectrum data of Chinese materia medica, four classifiers, namely support vector machine (SVM), random forest (RF), extreme gradient lifting (XGBoost) and adaptive lifting algorithm (AdaBoost), were used to establish the identification model of the ascending, descending, floating and sinking of Chinese materia medica. The area under the curve (AUC), accuracy, precision, recall, and F1 value were selected as the evaluation indicators of the model. Results The AUC of the four identification models all reached more than 80%, among which XGBoost model showed the best performance. AUC reached more than 90%, and the accuracy, precision and recall were higher than other models, which could realize the accurate identification of rising and floating Chinese materia medica and descending and sinking Chinese materia medica. Conclusion The ascending, descending, floating and sinking identification model of rising and floating Chinese materia medica and descending and sinking Chinese materia基金项目:国家自然科学基金(81973495)通讯作者:王耘,E-mail:wangyun@bucm.edu.cn
medica based on the Raman spectrum data of Chinese materia medica after feature selection, combined with XGBoost clssifier can realize the accurate identification of rising and floating Chinese materia medica and descending and sinking Chinese materia medica.
Keywords: Chinese materia medica; medicinal properties; ascending, descending, floating and sinking; Raman spectrum; identification model
升降浮沉是指药物对人体作用的不同趋向性[1]。作为中药药性特征之一,升降浮沉在指导临床用药与方剂配伍过程中具有重要作用。目前,升降浮沉理论相关研究主要集中在古籍溯源研究[1-3]、方剂内涵原理探讨[4-6]、药性考证或药效比较[7-9]。药理研究表明,中药升降浮沉药性对人体特定方向或病势的疾病起着显著或特殊的调节作用[10]。如药性“升”具有催吐、发汗、
升阳、开窍、清头目、通鼻窍、聪耳明目、生津止渴的功效,药理作用表现为兴奋呕吐中枢、催吐、发汗、解热等[11]。
升与降、浮与沉对立统一,对具有相同作用趋势的中药进行共有特征探索与辨识研究,有望揭示升降浮沉的科学内涵。油雨忻等[12]提出“中药升降浮沉药性的物质基础是中药成分”假说,利用紫外指纹图谱表征中药成分,结合支持向量机(SVM)算法初步构
建了中药升降浮沉判别模型,为中药药性物质基础与升降浮沉理论研究提供了新思路。然而,中药指纹图谱的优势体现在对已知化学成分的准确鉴定,无法整体表征中药这一复杂体系。样品制备的要求也增加了研究的复杂性。中药物质基础的复杂性使草本中药可看作由分子构成的整体集合体系,拉曼光谱为分子散射光谱,能够对中药进行直接检测分析,即可以在保留中药整体特性的情况下得到量化表征数据,进而开展后续研究。因此,本研究基于中医药整体观,以“升降浮沉”为研究对象,测定中药拉曼图谱,经特征筛选获取不同药性拉曼光谱特征,结合机器学习方法建立中药升降浮沉特性辨识模型并开展评价,以期得到基于拉曼光谱的升降浮沉药性量化表征精准数据和辨识模型,揭示中药升浮与沉降的科学内涵,促进升降浮沉理论的现代化发展。
1 仪器与试药
SEED型近红外拉曼光谱仪(Seabreeze Laser激光器,XS11639-B40090157光谱仪系统,上海如海光电公司),YP-2TS型压片机(天津中世沃克有限公司), RS-FS1801型中药材超微粉碎机(广州荣事达有限公司)。
白芷、薄荷、苍术、细辛、生姜、旋覆花、阿胶、枇杷叶、紫苏子、大黄等药材共239种(升浮药101种,沉降药138种),安国市桓荣中药材有限公司提供(送货号Q010246),经北京中医药大学中药学院王耘团队鉴定,所有药材均符合2020年版《中华人民共和国药典》[13]规定;超纯水(屈臣氏有限公司,货号hs6303)。
2 方法与结果
2.1 样品预处理
中药材用超纯水洗净,去除表面灰尘等杂质,置于真空干燥箱中,26 ℃恒温干燥1 h。用超微粉碎机打成粉末,过3号筛,利用小型不锈钢压片模具压片,即得待测样品。
2.2 检测条件
激光器类型为板载激光器;中心波长785 nm;功率120 mW;积分时间7 000 ms;平均采集3次;平均模式为硬件平均;拉曼位移200~3 200 cm-1;基线处理条件为lambda 10 000,order 2;平滑滤镜lambda 20, order 2。
2.3 数据采集
将待测药材粉末压片或器皿放置于样品台上,随机选取10个不同的部分依次进行检测,采用连续扫描收集、激光自动模式,共采集10次,以10次检测的平均拉曼谱图作为该药材最终表征谱图。
2.4 方法学考察
2.4.1 专属性考察
以枸杞子、山药、茯苓、刺五加、冰片5味药进行专属性考察,按上述条件进行检测。功率调至0 mW,采集特征拉曼位移(cm-1)及其所对应的峰强(I),得到空白谱图。结果见图1。表明不同中药因性质的差异表现出各异的拉曼谱图,峰形良好,无明显荧光干扰。
2.4.2 精密度考察
以柏子仁、西洋参、苏合香、土木香、天花粉5味药进行仪器精密度考察。经样品预处理后,每味药分别制备6份待测样品,先后放置于样品台上进行拉曼光谱检测,记录中药拉曼谱图的特征拉曼位移及其所对应的峰强,并计算RSD。同时,对拉曼谱图进行逆峰位匹配检索,计算谱图相似度。结果RSD均小于4.12%,相似度均大于86.0%,表明仪器精密度良好。
2.4.3 重复性考察
以取自不同产地(山东、河北、宁夏、江苏、湖南)的当归、黄柏、山药3味药进行重复性考察。经样品预处理后,每味中药待测样品先后进行5次拉曼光谱检测,记录中药拉曼谱图的特征拉曼位移及其所对应的峰强,并计算RSD。同时进行逆峰位匹配检索,计算谱图相似度。结果RSD均小于3.62%,相似度均大于85.7%,表明重复性良好,且不同产地的同种中药拉曼谱图整体上基本一致。
2.5 数据处理及特征筛选
按“2.3”项下方法得到101味升浮药与138味沉降药的拉曼谱图数据,以1 cm-1为单位进行量化处理,每味药得到3 000个拉曼指标,建立239味中药的拉曼数据集。“升降浮沉”数据依据2020年版《中华人民共和国药典》[13]和《中药大辞典(第二版)》[14]的中药功效作用趋向结合判定标准分析:具有解表、透疹、祛风(湿)、升阳举陷、开窍、醒神、温阳补火、行气、解郁、涌吐等功效的中药,作用趋向为“升浮”,如薄荷、柴胡、升麻、苍术等;具有清热、泻下、利湿、安(养)神、止呕、抑肝阳、息风止痉、止咳、平喘、收敛固涩、止血等功效的中药,作用趋向为“沉降”,如白芍、葶苈子、苦杏仁、牡蛎等[2,15-16]。本研究采用带有交叉验证的递归特征消除(RFECV)对拉曼谱图数据进行特征筛选。该方法分为两部分:递归特征消除(recursive feature elimination, RFE)[17]通过一个基模型进行模型训练,对3 000个拉曼波段进行特征重要性排序,删除重要性最低的特征,
利用新特征集进行下一轮训练,循环往复直至达到所
需的特征数量;再通过交叉验证(cross validation, CV)筛选出最优特征子集。本研究使用轻量级梯度提升机(LGBM)集成算法[18]作为RFE的基模型。以LGBM_RFE作为特征筛选算法筛选出与升降浮沉显著相关的拉曼波段,交叉验证次数为5,每次删除的特征个数为1,最终保留126个最优拉曼波段进行中药升降浮沉特性辨识模型的训练。
2.6 模型构建及评价
为得到良好的辨识模型,本研究基于特征筛选后的中药拉曼谱图数据结合SVM、随机森林(RF)、极度梯度提升(XGBoost)和自适应提升(AdaBoost)分类器建立中药升浮沉降辨识模型,将数据集按7∶3比例随机划分为训练集和测试集,使用不同模型进行训练与预测,并用曲线下面积(AUC)、准确率、精确度、召回率及F1值作为模型的评价指标。以上4种分类器均通过随机网格搜索十折交叉验证进行参数调试和优化,最优超参数设置见表1,模型比较见表2。
表1 4种分类器的最优超参数设置
算法 超参数设置
SVM C=0.001,kernel='linear',probability=True,gamma=0.001 RF n_estimators=180,max_depth=9,min_samples_split=2, random_state=0 XGBoost learning_rate =0.01,n_estimators=800,max_depth=6, min_child_weight=1,gamma=0.0,subsample=0.8, colsample_bytree=0.9,reg_alpha=0.01,reg_lambda=0.1,seed=0 AdaBoost learning_rate=0.07,n_estimators=80,algorithm='SAMME.R', random_state=0
表2 4种辨识模型评价指标比较(%)分类算法 AUC准确率精确度召回率 F1值SVM 83.79 76.39 69.23 66.67 67.92 RF 89.30 77.78 70.37 70.37 70.37 XGBoost 91.11 86.11 86.95 74.07 80.00 AdaBoost 88.23 84.72 86.36 70.37 77.55
4种辨识模型的AUC均达到80%以上,其中XGBoost模型AUC达90%以上,说明该模型的分类效果极佳。相较于其他模型,XGBoost模型的准确率更高,整体效果更好;精确度和召回率更高,说明对升浮中药和沉降中药的区分能力更强;F1值更高说明模型更加稳健。明显优于已报道模型(AUC为0.831 6,准确率为80.00%)[12]。综上,XGBoost模型表现最优,可以实现对升浮中药和沉降中药的准确辨识。
为深入了解126个最优拉曼波段与升降浮沉中药辨识结果之间的关系,选用SHAP (SHapley Additive exPlanations)方法[19]对基于XGBoost构建的升浮沉降辨识模型的识别结果进行解释,以此反映最优拉曼波段对药性识别结果的影响及其正负性,可视化部分结果见图2。模型中最重要的前10个拉曼波段分别位于I2289、I2105、I1066、I2343、I2415、I2425、I1140、I2591、I458、I2291。图中每个点代表1个样本,点的颜色代表拉曼波段强度。如波段I2105,红色点主要集中于横坐标正值,蓝色点主要集中于横坐标负值,表明此波段拉曼强度越高其药性辨识结果越趋于升浮,拉曼强度越低其药性辨识结果越趋于沉降;波段I1140,红色点主要集中于横坐标负值区域,表明此波段拉曼强度越高其药性辨识结果越趋于沉降。3讨论历代医书、历年版《中华人民共和国药典》及各版《中药学》教材对中药性、味、归经大多有明确记载,但均未从升降浮沉角度对单味中药性能进行明确论述。其原因之一是升降浮沉概念较为抽象,会根据医家个人经验发生改动。另一重要原因在于,中药的升降浮沉特性受性、味、归经、用药部位、药材质地、炮制、配伍等因素影响。从性味来看,性热、温,味甘、辛、淡属阳,多为升浮之性;性寒、凉,味酸、苦、咸属阴,多为沉降之性。若药物的性味阴阳属性不同,该药便具有升浮沉降双重特性。气味厚薄升降浮沉理论同样阐述了这一原理,气属阳、味属阴,中药气味阴阳共存,使一味中药存在升中有降、降中有升的可能。如从四气五味、气味厚薄、主治功效、方剂配伍四方面对桔梗药性进行考证,发现其不仅具有
显著的升浮之性,亦有苦泄沉降之功[20]。大黄峻下,
酒制后具备清上焦血分热毒功效。牛膝引血下行,配伍柴胡、桔梗后具有上升之力。一般来说,方剂的升
降趋势取决于方剂中具有相同趋势的大部分药味[21]。
因此,中药的升降浮沉特性受多种因素的影响并存在转化关系,这在一定程度上导致该理论发展缓慢。
由于升降浮沉特性的复杂性,探寻不同药性对应的物质基础与科学内涵尤为重要。中药是典型的复杂体系,药性中性、味、归经、升降浮沉、有毒无毒分别从不同维度对中药整体特点进行描述,每个维度必然对应着各自的物质基础。在探索各药性科学内涵的过程中,应秉持整体观思想。拉曼光谱属分子振动散射光谱,其形成与分子极化率和能级相关。本研究中,中药的检测过程保持了中药完整性,拉曼光谱从分子层面实现了中药的整体表征。
拉曼光谱检测中噪声较大,经常受到荧光效应的
干扰[22-25]。为抑制荧光效应,本研究采取如下方法:
①选定激发光中心波长
785 nm。中药荧光检测激发光波长大多位于紫外-可见光区,如山药330 nm、沙苑子410 nm、熟地黄470 nm等[26],而中心波长785 nm的激发光为近红外激光(760~830 nm),可在一定程度上抑制样品的荧光效应;②采用屈臣氏超纯水、甲醇、甲醇水轻微冲洗药材,去除表面灰尘、沾染物等杂质,避免杂质荧光效应的干扰;③仪器采取连续扫描采集模式,延长照射时间,利用“光致漂白”效应以最大程度达到抑制荧光干扰的效果[27]。
LGBM集成算法具有训练速度快、高准确度、适用于高维度数据等优点,可以高效、准确的对拉曼波段进行重要性排名。RFE算法通过迭代运算来选择最
重要的拉曼波段子集,从而减少特征数量,提高模型的准确度。两者联用的LGBM_RFE特征筛选算法可从3 000个拉曼波段中去除冗余数据,保留重要信息,筛选得到与升浮沉降相关性最强的拉曼波段子集。得到的126个最优拉曼波段是拉曼光谱在升降浮沉维度对中药的表征。拉曼位移主要集中在1 000~3 200 cm-1,此范围内升浮中药的拉曼强度普遍高于沉降中药。同时,采用SHAP方法对单味中药升降浮沉特征拉曼波段进行可视化,以此反映最优拉曼波段对升降浮沉药性识别结果的重要程度及正负向影响。拉曼谱图反映的不单是中药中的某一成分或某一元素,而是某一药性在中药本体的整体特征,是对药性进行科学内涵探索的必要选择。通过中药拉曼光谱图结合辨识模型,前期已
经实现对中药寒热药性、平性、甘味的辨识[28-30]。
本研究基于大宗中药材进行拉曼光谱检测,以拉曼光谱整体表征中药升降浮沉药性,结合LGBM_RFE算法筛选得到126个拉曼波段,在此基础上建立升降浮沉辨识模型,阐释升降浮沉的科学内涵,为客观识别中药的“升浮”和“沉降”趋势提供一种新方法。参考文献:
[1] 郭兆娟,袁一平,孔李婷,等.升降浮沉药性理论溯源及升降浮沉药对
配伍研究[J].中国中药杂志,2017,42(16):3225-3228.
[2] 杨曙光,王鹏.从《黄帝内经》气机升降出入学说谈升降浮沉药性理
论之渊薮[J].中华中医药杂志,2021,36(2):698-701.
[3] 刘金涛,翟双庆.张元素对气味厚薄升降浮沉理论的建构[J].中华中
医药杂志,2020,35(5):2428-2431.
[4] 郭建波,宋丽娜,栾俊琦,等.基于升降浮沉理论探讨升降散在儿童急
性化脓性扁桃体炎中的应用[J].中国医药导报,2022,19(14):150-153. [5] 苏坤涵,刘万里,黄玉珍.基于药性理论探讨理气药在胃食管反流病治
疗中的应用[J].天津中医药大学学报,2021,40(3):319-324.
[6] 刘守传,马君.从中药升降浮沉药性探讨新冠肺炎“三药”[J].亚太
传统医药,2022,18(10):225-228.
[7] 仲宗亮.生大黄、清半夏、常山升降浮沉药性的实验研究[D].济南:
山东中医药大学,2014.
[8] 王梦梦,克迎迎,米汪洋,等.基于肺水肿模型探讨葶苈子升降浮沉药
性[J].中国实验方剂学杂志,2022,28(15):42-52.
[9] 袁培培,侯颖,李潘营,等.基于中药功效药理学的葶苈子沉降药性研
究[J].中药药理与临床,2022,38(2):124-131.
[10] 徐瑞齐,曾梦楠,赵一凡,等.基于升降浮沉药性理论比较麻黄和葶苈子
对风水水肿模型的影响[J].中华中医药杂志,2022,37(10):5682-5689. [11] 项丽玲,李艳,苗明三.升降浮沉药性现代药理研究的分析与思考[J].
中华中医药杂志,2019,34(11):5269-5272.
[12] 油雨忻,李若轩,段梦雨,等.基于支持向量机的中药升降浮沉药性识
别模型[J].时珍国医国药,2022,33(11):2801-2804.
[13] 国家药典委员会.中华人民共和国药典:一部[M].北京:中国医药科
技出版社,2020.
[14] 赵国平,戴慎,陈仁寿.中药大辞典(第二版)[M].上海:上海科学技术
出版社,2015.
[15] 张延模.中药学[M].北京:高等教育出版社,2008:17-25.
[16] 高学敏.中药学[M].7版.北京:中国中医药出版社,2003:1-100. [17] Guyon I, Weston J, Barnhill S, et al. Gene selection for cancer classification using support vector machines[J]. Machine Learning,2002,46(1):389-422.
[18] Ke G, Meng Q, Finley T, et al. Lightgbm: A highly efficient gradient boosting decision tree[J]. Adv Neural
Inform Process Syst,2017,30:3146-3154.
[19] Lundberg S M, Erion G, Chen H, et al. From local explanations to global understanding with explainable AI for trees[J]. Nat Mach Intell,2020,2(1):56-67.
[20] 杨曙光,王鹏,开菲.桔梗升降浮沉药性考辨[J].中国中医基础医学
杂志,2022,28(8):1323-1325,1366.
[21] 仲宗亮,荀丽英,战旗,等.中药升降浮沉的理论研究[J].福建中医
药,2012,43(4):61-62.
[22] 陈怡帆.面向复杂液相体系的拉曼光谱荧光抑制技术及应用[D].杭
州:浙江大学,2020.
[23] 王欢,王永志,赵瑜,等.拉曼光谱中荧光抑制技术的研究新进展综述[J].
光谱学与光谱分析,2017,37(7):2050-2056.
[24] 周红武.便携式拉曼光谱仪中荧光抑制方法的研究[D].苏州:苏州大
学,2013.
[25] Rojalin T, Kurki L, Laaksonen T, et al. Fluorescencesuppressed time-resolved raman spectroscopy of pharmaceuticals using complementary metal-oxide semiconductor (CMOS) single-photon avalanche diode (SPAD) detector[J]. Analytical Bioanalytical Chemistry,2016,408(3):761-774. [26] 樊凤杰,轩凤来,白洋,等.基于三维荧光光谱特征的中药药性模式识
别研究[J].光谱学与光谱分析,2020,40(6):1763-1768.
[27] 朱自莹,顾仁傲,陆天虹,等.拉曼光谱在化学中的应用[M].沈阳:东
北大学出版社,1997:31-38.
[28] 梁浩,纪徐维晟,王献瑞,等.基于中药拉曼谱图的寒热药性判别研究[J].
世界中医药,2023,18(1):65-69.
[29] 纪徐维晟,梁浩,刘淑明,等.基于拉曼光谱的平性中药辨识研究[J].
中国现代中药,2022,24(12):2364-2370.
[30] 沙晗,刘淑明,王慧,等.基于拉曼光谱的中药甘味辨识方法研究[J].
中南药学,2022,20(8):1824-1828.
(收稿日期:2023-03-17) (修回日期:2023-04-13;编辑:陈静)