CJI (Traditional Chinese Medicine)
基于双清合剂人用经验数据的儿童中成药用药剂量模型构建
栾奕博,张依,郭圣璇,李璇,胡思源天津中医药大学第一附属医院,国家中医针灸临床医学研究中心,天津 300381
摘要:目的 构建以双清合剂为示范的儿童中成药用药剂量模型,探索本品种在儿童人群的用药剂量,为临床合理用药提供参考,为变更儿童人群的注册申请或说明书的完善提供人用经验证据支持。方法 选取天津中医药大学第一附属医院医院信息系统2012年9月-2021年10月至少使用过1次双清合剂的人用经验数据。通过数据提取、清洗和规范化,描述基本信息、诊断信息和用药信息等的频次分布,寻找患儿用药规律,构建基于一维优化K-means算法的探索年龄段成人-儿童用药剂量折算模型和基于XGBoost算法的儿童中成药用药剂量多分类预测模型。结果 共纳入用药记录31 303条,学龄前期患儿最多见(35.72%),西医诊断以急性上呼吸道感染(40.17%)、急性支气管炎(18.87%)为主,中医诊断以感冒(14.21%)和咳嗽(11.75%)为主,平均用药疗程(3.06±1.16)d,单日用药平均剂量(40.61±12.15)mL。22 272例合并用药,西药最常与抗生素类药物合用,使用频率最高为阿奇霉素(8.05%);中成药最常与解表清热剂合用,使用频率最高的是小儿豉翘清热颗粒(12.10%)。对排名前5位西医诊断的用药剂量进行分析,基于描述性统计结果的固定年龄段成人-儿童用药剂量折算比例为:幼儿期用1/2~3/5成人量,学龄前期用2/3~3/4成人量,学龄期用4/5~1成人量;基于一维优化K-means算法建模分析结果的探索年龄段被划分为3~4个年龄段,各年龄段对应各自折算比例。建立基于XGBoost算法的儿童中成药用药剂量多分类预测模型,输出不同诊断的各年龄段最佳用药剂量阈值,模型准确度为84.1%。结论 本研究揭示了双清合剂在儿科真实医疗环境的用药特征,构建了基于机器学习算法的模型,规范儿童分年龄段用药剂量折算比例和各年龄最佳用药剂量阈值,可为双清合剂在儿童临床应用提供合理的用药方案,为本品种变更儿童人群的注册申请或说明书的完善提供人用经验证据支持。
关键词:双清合剂;医院信息系统;真实世界研究;机器学习;剂量模型
中图分类号:R272 文献标识码:A 文章编号:1005-5304(2023)10-0145-06 DOI:10.19879/j.cnki.1005-5304.202210102 开放科学(资源服务)标识码(OSID): Construction of Dosage Models for Children Based on Empirical Data of Mixture
Shuangqing
First Teaching Hospital of Tianjin University of Traditional Chinese Medicine, National Clinical Research Center for
Chinese Medicine Acupuncture and Moxibustion, Tianjin 300381, China
Abstract: Objective To construct the dosage model for children with Shuangqing Mixture as an example; To explore the dosage of this kind of medicine in children; To provide a reference for clinically rational medication; To provide human empirical evidence support for the change of registration application of children or improvement of the specification. Methods The human use experience data of Shuangqing Mixture used at least once from September 2012 to October 2021 in HIS database of First Teaching Hospital of Tianjin University of Traditional Chinese Medicine were selected. Through data extraction, cleaning and standardization, the frequency distribution of basic information, diagnostic information and medication information was described to find the medication law in children. The conversion model based on a one-dimensional optimized K-means algorithm was constructed for exploring age基金项目:国家科技重大专项—重大新药创制( 2020ZX09201-008 );中国儿童中药真实世界研究技术指南( GNB-620210304-68)
通讯作者:胡思源,E-mail:husiyuan1963@sina.com
group adults-children and a multi-classification prediction model based on the XGBoost algorithm for the dosage of children. Results Totally 31 303 records of medication were included in the study. Most of them were preschool children (35.72%). The diagnosis of Western medicine was mainly acute upper respiratory tract infection (40.17%) and acute bronchitis (18.87%), and the common cold (14.21%) and cough (11.75%) were the main diseases diagnosed by TCM. The average course of treatment was (3.06±1.16) days and the average dosage of a single day was (40.61± 12.15) mL. Of the 22 272 cases, Western medicines were most often combined with antibiotics, and the most frequently used was azithromycin (8.05%). In contrast, Chinese patent medicines were most often combined with Jiebiao Qingre formula, and the most frequently used was Xiaoer Chiqiao Granule (12.1%). An analysis of the top 5 Western medicine diagnoses was conducted. Based on the descriptive statistical results, the dosage conversion ratio of fixed-age adults to children was as follows:1/2–3/5 adults in early childhood, 2/3–3/4 adults in preschool age and 4/5–1 adults in school age were used. Based on the modeling results of one-dimensional optimal K-means algorithm, the age of exploration was divided into three or four age groups, and each age group corresponded to its own conversion ratio. A multi-classification prediction model of dosage of Chinese patent medicine for children was established based on XGBoost algorithm, and the dosage threshold of children in different age groups was output, with the accuracy of the model’s accuracy of 84.1%. Conclusion This study reveals the characteristics of Shuangqing Mixture in the real world. A model based on machine learning algorithm is constructed to standardize the dosage conversion ratio and the optimal dosage threshold of children in different age groups to provide a reasonable medication plan for the clinical application of Shuangqing Mixture in children; provide human use of empirical evidence to support the registration application or the improvement of the specification for children with this variety change.
Keywords: Shuangqing Mixture; HIS; real world study; machine learning; dosage model
目前,我国儿童用药存在品种少、剂型少、规格少和标识少的问题,中成药作为儿童用药的重要组成部分,在缓解儿童用药需求、保障儿童生命健康方面有重要价值和良好前景。然而中成药在儿童人群的合理应用面临问题和挑战,主要为用法用量信息不完善,难以规范地指导临床应用,超说明书用药现象普遍存在,如儿童专用中成药的低年龄段用法用量缺失、成人儿童共用中成药大多仅标注“儿童酌减”或“儿童在医师指导下服用”、成人中成药应用于儿童等。因此,完善用于儿童的中成药用法用量信息十分必要。
随着中医药理论、人用经验和临床试验相结合的中药注册审评证据体系的构建与优化,以及《“十四五”中医药发展规划》[1]、《基于人用经验的中药复方制剂新药临床研发指导原则(试行)》[2]、《中药注册管理专门规定》[3]等的发布,人用经验证据在中药注册
审评中的应用日益受到高度重视。真实世界研究
管炎的中成药,属成人用药品种,缺乏儿童用法用量信息,但在儿科临床应用多年,人用经验丰富,具有大样本量、可靠真实和结构完整的来源于HIS的人用经验数据[5]。本研究以双清合剂的HIS数据为切入点,通过机器学习方法,整理和分析其人用经验数据,构建探索年龄段成人-儿童用药剂量折算模型和儿童中成药用药剂量多分类预测模型,获得符合临床实践的儿童人群用法用量,以期优化双清合剂的临床用药方案,为变更儿童人群的注册申请或说明书的完善提供人用经验证据支持。
1 资料与方法
1.1 研究设计
本研究为回顾性数据库研究,数据来源于天津中医药大学第一附属医院HIS数据库,提取2012年9月-2021年10月至少使用过1次双清合剂的患儿的诊疗信息。
1.2 研究对象
1.2.1 纳入标准
①年龄 岁;②就诊方式为儿科门诊/急诊。
1~14
1.2.2 排除标准
①处方存在明显逻辑错误;②合并使用中药汤剂; ③无法对疾病诊断进行规范化的患儿。
1.3 观察指标
①基本信息:年龄、性别、就诊方式;②诊断信息:西医诊断、中医诊断;③用药信息:研究用药(包括疗程、剂量)、合并用药(包括名称、类别)。
1.4 数据处理
1.4.1 数据提取与清洗
以Excel2021建立数据库,采用Python3.8.12软件进行数据处理。
数据提取:根据纳入和排除标准,剔除不符合标准的患儿数据。
数据清洗:包括重复数据、逻辑错误和缺失数据的清洗等。在保证数据完整的前提下,去除重复数据及不相关数据;进行逻辑检查,去除逻辑错误的数据,包括出生年月与按年龄推算不符、单日用药剂量为
100 mL、给药途径为皮试等;对缺失数据进行处理,
根据完整的数据分析进行必要填补。
1.4.2 数据规范
规范诊断信息和处方信息。西医诊断信息参照《国际疾病分类(第11次修订本)》[6]和《儿科学(第8版)》[7]进行规范化,中医诊断信息参照《中医病证分类与代码(修订版)》[8]进行规范;西药采用《药物的解剖学、治疗学及化学分类系统》[9]分类合并;中成药以药物成分为准,将成分相同、剂型不同者合并,参照药品说明书对其名称进行规范。
1.5 统计学方法
采用R语言4.2.0对数据进行统计分析,主要采用描述性统计和建模分析的方法。
用药特征的描述性统计:组合运用dplyr及ggplot2函数库,分别对年龄、性别、就诊方式、西医诊断、中医诊断、研究用药疗程和剂量、合并用药名称和类别进行描述性统计。定量数据描述例数、均数、标准差;定性数据描述频数、百分率或构成比。用药剂量建模分析:①采用一维优化
K-means算置排名前5位西医诊断为筛选条件,各诊断对应的诊疗数据为数据子集,患儿年龄为特征变量(自变量),双清合剂儿童用药剂量较成人用药剂量的折算百分比为目标变量(因变量)。将K-means模型的聚类数量的初始范围设定为3~5,以Calinski-Harabaz指数[11]为评估指标,针对不同诊断的数据子集,采用迭代检验的优化策略。②基于患儿用药特征的描述性统计结果,采用XGBoost算法[12]构建儿童中成药用药剂量多分类预测模型。设置年龄、性别、就诊方式、西医诊断、中医诊断、研究用药疗程、合并用药数量、合并用药名
法[10]构建探索年龄段成人-儿童用药剂量折算模型。设
称等为特征变量(自变量),目标变量被整合为[0,10)、[10,20)、[20,30)、[30,40)、[40,50)、[50,60)、[60,70)、[70,80)和[80,90]的区间进行多极分类预测。随机抽取样本中80%数据训练模型,20%数据验证模型,经过多次随机交叉检验,根据计算预测结果的混淆矩阵检验模型准确度,对各年龄段患儿最佳用药剂量区间进行预测。
2 结果
2.1 基本信息
本研究共收集用药记录51 958条,按纳入标准、排除标准筛选和处理数据后,纳入用药记录31 303条。男性16 861例(53.86%),女性14 442例(46.14%)。急诊17 882例(57.13%),门诊13 421例(42.87%)。年龄1~14岁,平均(5.44±3.14)岁,各年龄段均有分布,以学龄前期患儿最多,共11 181例(35.72%)。2.2 诊断信息
31 303例患儿信息中包含诊断信息44 146条。西医诊断主要涉及呼吸系统,除说明书中明确的急性支气管炎外,还涉及急性上呼吸道感染、急性扁桃体炎、急性喉炎、肺炎等上呼吸道感染和下呼吸道感染。急性上呼吸道感染有广义和狭义之分,广义指外鼻孔至环状软骨下缘包括鼻腔、咽或喉部急性炎症的总称,临床表现主要类型为普通感冒、急性病毒性咽-扁桃体炎,还可包括疱疹性咽峡炎、咽结合膜热、急性细菌性咽扁桃体炎、急性喉炎等;狭义指普通感冒这一临床表现。通过分析原始数据特点,本研究所指急性上呼吸道感染属狭义范畴。结果显示,患儿以急性上呼吸道感染最多见,共17 733例(40.17%),其次为急性支气管炎( 8 330 例, 18.87% )和急性扁桃体炎(2 044例,4.63%)。中医诊断主要涉及肺系和脾胃系疾病,集中在感冒(6 275例,14.21%)和咳嗽(5 188例, 11.75% ),也可见于肺炎喘嗽、乳蛾和积滞等。见表1。
表1诊断
使用双清合剂患儿主要中西医诊断(前5位)
频次百分比/%诊断频次百分比/%西医诊断急性上呼吸道感染急性支气管炎急性扁桃体炎肺炎急性喉炎17 733 8 330 2 044 1 344 290 40.17 18.87 4.63 3.04 0.66
中医诊断感冒咳嗽肺炎喘嗽乳蛾积滞6 275 5 188 352 305 54 14.21 11.75 0.80 0.69 0.12注:存在多个诊断信息的患儿数据,根据不同诊断分别计入各自频数及百分比
2.3 用法用量
2.3.1 用药疗程
用药疗程平均为(3.06±1.16)d,排名前5位西医诊断的疗程分别为急性上呼吸道感染(3.01±1.17)d、急性支气管炎(3.09±1.01)d、急性扁桃体炎(3.04± 0.95)d、肺炎(3.0±1.11)d和急性喉炎(3.38±0.96)d。2.3.2 用药剂量
单日用药平均剂量为(40.61±12.15)mL,急性扁桃体炎的用药剂量最多,为(45.56±12.9)mL,急性喉炎的用药剂量最少,为(39.67±10.77)mL。
无儿童用量的儿童中成药用药剂量,一般采用基于国内通用年龄分期、分年龄段、按成人用药剂量的折算方法,固定年龄段折算比例为幼儿期用1/2成人量、学龄前期用2/3成人量和学龄期用成人量[13]。本研究中,排名前5位西医诊断的固定年龄段成人-儿童用药剂量折算比例的趋势一致,均在幼儿期用1/2~3/5成人量、学龄前期用2/3~3/4成人量和学龄期用4/5~1成人量,幼儿期高于用1/2成人量、学龄前期用2/3成人量、学龄期用成人量的范围内。不同诊断的各年龄段内折算比例存在差异,考虑与适应证的病情严重程度有关。相同诊断的单独用药和合并用药的各年龄段内折算比例差异较小。见表2。
表2 西医诊断排名前5位的固定年龄段成人-儿童用药折算比例(%)急性上呼吸道感染急性支气管炎急性扁桃体炎肺炎急性喉炎2.4西医诊断幼儿期单独 联合54.17 54.62 52.25 56.30 49.58 51.08 55.61 55.46 56.12 53.22学龄前期单独68.40 66.14 72.49 69.48 72.22
联合65.88 67.37 69.06 67.52 69.23学龄期单独84.01 81.28 85.81 84.34 84.38
联合82.53 83.56 89.31 89.17 80.68
合并用药
22 272例患儿采用合并用药,包含合并用药信息36 031条。共使用60种西药和43种中成药。合并用药使用频率前10位的药物和药物作用类型见表3、表4。可见,西药最常与抗生素类药物合用,使用频率最高
为阿奇霉素(8.05%);中成药最常与解表清热剂合用,使用频率最高为小儿豉翘清热颗粒(12.10%)。
表3 使用双清合剂患儿合并用药情况(前10位)
合并用药西药阿奇霉素布洛芬头孢克洛头孢克肟对乙酰氨基酚磷酸奥司他韦氨溴索盐酸丙卡特罗布地奈德氢溴酸右美沙芬表4
使用双清合剂患儿合并用药药物类型(前10位)
药物类型
频次 百分比/%合并用药中成药小儿豉翘清热颗粒蒲地蓝消炎口服液小儿肺热咳喘口服液肺力咳合剂小儿消积止咳口服液小儿柴桂退热颗粒九味双解口服液金振口服液沙棘干乳剂橘红痰咳液2 899 2 248 2 060 1 903 1 287 811 751 719 436 435西药β-内酰胺类非甾体类抗炎大环内酯类β2肾上腺素受体激动剂抗病毒药祛痰药皮质类固醇类中枢性镇咳药白三烯受体拮抗剂抗组胺药8.05 6.24 5.72 5.28 3.57 2.25 2.08 2.00 1.21 1.21
频次4 528 3 535 2 899 1 268 811 761 718 435 374 354百分比/%药物类型中成药解表清热剂清热解毒剂清热化痰剂清热止咳剂清热消积剂消食化滞剂清热通窍剂化痰止咳剂平肝熄风剂清热利咽剂12.57 9.81 8.05 3.52 2.25 2.11 1.99 1.21 1.04 0.98
频次 百分比/% 4 360 4 224 3 573 1 268 1 078 972 818 661 628 235
频次 百分比/% 6 271 4 227 3 576 2 210 1 078 749 288 235 213 157 12.10 11.72 9.92 3.52 2.99 2.70 2.27 1.83 1.74 0.65 17.40 11.73 9.92 6.13 2.99 2.08 0.80 0.65 0.59 0.44 2.5 用药剂量模型
2.5.1 探索年龄段成人-儿童用药剂量折算模型
固定年龄段成人-儿童用药剂量折算比例大多为相对较大的区间。本研究在双清合剂的儿童用药剂量中寻找规律,结合不同适应证特点,采用一维优化K-means算法构建探索年龄段儿成人-儿童用药剂量折算模型,以Calinski-Harabaz指数为评估指标,针对不同诊断的数据子集,分别通过20次迭代检验确定模型的最优聚类数量与对应结果,合理划分为3个或4个年龄段,并分别计算出用药剂量折算比例。见图1、图2。
图2单独使用双清合剂的探索年龄段成人-儿童用药剂量折算比例2.5.2 儿童中成药用药剂量多分类预测模型
为探索不同年龄段划分规则下的各年龄段最佳用药剂量阈值,基于双清合剂在儿童临床应用的基本信息、诊断信息和用药信息,采用XGBoost算法构建用于预测儿童用药最佳剂量区间的多分类模型,经过10次随机交叉检验,完成对模型准确度的验证,结果发
现,当 n_estimators=100,max depth=10,gamma=0, colsample_bytree=1,min_child_weight=1,subsample=1时模型表现最佳,准确度为84.1%,见图3。通过特征变量在模型中的重要性得分,发现对模型准确度影响最大的是患儿年龄,对模型准确度影响最小的为是否合并中成药。各特征变量对模型影响程度的评分和排
序见图4。
本研究建立黑箱式应用系统,系统后端为建模结果,前端为用户界面,临床医生或研究者可在用户界面输入数据,并得到预测用量区间。同时,所得的预测用量区间与临床医生或研究者输入的数据绑定,传递给儿童中成药用药剂量多分类预测模型,扩展模型的训练数据。系统界面示意图见本文OSID码。3图4特征变量对模型准确度的重要性评分讨论本文采用回顾性数据库研究方法,整理并分析双清合剂在儿童人群的人用经验数据,构建探索年龄段成人-儿童用药剂量折算模型和儿童中成药用药剂量多分类预测模型,探索本品种适应证、适用人群范围和儿童用药剂量,以优化临床用药方案并支持后续临床研究的开展。
研究结果显示,患儿各年龄段均有分布,以学龄前期最为多见,提示若需增加儿童适用人群时,建议优先考虑3~7岁患儿。诊断信息方面,急性支气管炎和咳嗽属说明书适应证,临床还常见于急性上呼吸道感染(感冒)、急性扁桃体炎(乳蛾)、肺炎(肺炎喘嗽)和急性喉炎等,提示若需增加功能主治时,可考虑上述适应证。
用药剂量是儿童中成药合理应用于临床的关键要素,如何确定用药剂量是儿童药品上市前和上市后密切关注的内容之一,儿童中成药一般采用分年龄段给药的方式,儿童用药剂量可以按成人剂量折算,即按照一定比例直接折算到儿童,折算比例多为相对较大区间。目前,大多采用基于国内通用年龄分期的固定年龄段成人-儿童用药折算比例,本研究中,幼儿期用药剂量为通用折算比例,学龄前期和学龄期用药剂量低于通用折算比例。但通用的年龄段划分区间较大,可考虑根据具体品种特性、适应证特点和临床经验,
合理划分1个或多个年龄段并分别计算使用剂量[14]。因此,根据双清合剂的数据特点,通过基于一维优化K-means算法的建模分析的方法,合理划分年龄段,并分别计算出各年龄段的用药剂量折算比例。
另外,合并用药亦是影响用药剂量的因素之一。本研究发现,合并其他药物治疗时,双清合剂的用药剂量更低;合并用药数量、合并用药种类可能对研究药物的用药剂量产生影响。
因此,本研究设置年龄、性别、就诊方式、西医诊断、中医诊断、研究用药疗程、合并用药数量、合并用药名称等特征变量,输出用药剂量区间为目标变量,构建基于XGBoost算法的儿童中成药用药剂量多分类预测模型,探索不同年龄段划分规则下的各年龄段最佳用药剂量阈值,即模型输出的用药区间由2个数值界定的范围构成,最小剂量和最大剂量均为药物有效剂量,临床医生处方时和临床研究设计可在区间内选择合适剂量。
本研究尚存在局限性:①为单中心研究,数据来源缺乏广泛性,今后将开展多中心、更深层次的研究。②提取的数据缺乏处方医生的职称信息,可能对处方准确性产生影响。③本研究方案中包含对中医证候诊断信息的提取,但经过筛选和数据处理后,中医证候诊断信息的数据样本量较小,因此未纳入分析。④仅以成人中成药双清合剂为示范品种,探索为扩大到儿童适用人群提供证据支持的方法,今后还需要应用在更多的同类型品种,以及推广到其他类型儿科中成药开发,如院内制剂,儿童中成药或成人儿童共用中成药增加新的儿童适用人群、增加功能主治等用法用量的选择与确定,提供方法学借鉴。
4 结论
本研究揭示了双清合剂在儿科真实医疗环境的用药特征,其适用人群以3~7岁为主,适应证常见于急性上呼吸道感染(感冒)、急性支气管炎(咳嗽)、急性扁桃体炎(乳蛾)、肺炎(肺炎喘嗽)和急性喉炎等。本研究构建了基于机器学习算法的模型,规范儿童分年龄段用药剂量折算比例和各年龄段最佳用药剂量阈值,可为双清合剂在儿童临床应用提供用药方案参考,并为本品种变更儿童人群的注册申请或说明书的完善提供人用经验证据支持。参考文献:
[1] 国务院办公厅.“十四五”中医药发展规划[EB/OL].(2022-03-09) [2022-11-20]. http://www. gov. cn/xinwen/2022-03/29/content_ 5682270.html.
[2] 国家药品监督管理局药品审评中心.基于人用经验的中药复方制剂新药临床研发指导原则(试行)[EB/OL].(2022-04-29)[2022-04-30]. https://www.cde.org.cn/zdyz/domesticinfopage?zdyzIdCODE=ab8a 9785226f419b63e5b2ab02242073.
[3] 国家药品监督管理局.中药注册管理专门规定[EB/OL].(2023-02-10) [2023-02-10].https://www.nmpa.gov.cn/xxgk/ggtg/qtggtg/202302 10173401120.html.
[4] 栾奕博,胡思源.人用经验证据支持儿童中药新药注册及说明书变更
的若干思考[J].药物评价研究,2022,45(2):205-209.
[5] 药智网 . 双清合剂说明书 [EB/OL]. (2007-07-25) [2022-08-01]. https://db.yaozh.com/instruct?comprehensivesearchcontent=%E5% 8F%8C%E6%B8%85%E5%90%88%E5%89%82.
[6] 世界卫生组织.国际疾病分类(第11次修订本)[EB/OL].(2021-05-01)
[2022-11-18].https://icd.who.int/browse11/l-m/en.
[7] 王卫平.儿科学(第8版)[M].北京:人民卫生出版社,2013.
[8] 国家卫生健康委员会,国家中医药管理局.中医病证分类与代码(修订版)[EB/OL](2020-11-23)[2022-02-20].http://yzs.satcm.gov.cn/ zhengcewenjian/2020-11-23/18461.html.
[9] The WHO Collaborating Centre for Drug Statistics Methodology. Anatomical therapeutic chemical classification system[EB/OL].(2023-01-23)[2023-01-23].https://www.whocc.no/ atc_ddd_index/.
[10] Wang H, Song M. Ckmeans.1d.dp:Optimal K-means clustering in one dimension by dynamic programming[J]. R J,2011,3(2): 29-33.
[11] Teng G, Wang Q, Cui X, et al. Predictive data clustering of laser-induced break down spectroscopy for brain tumor analysis[J]. Biomed Opt Express,2021,12(7):4438-4451.
[12] 齐巧娜,刘艳,陈霁晖,等.机器学习XGBoost算法在医学领域的应用
研究进展[J].分子影像学杂志,2021,44(5):856-862.
[13] 马融.中医儿科学(新世纪第四版)[M].北京:中国中医药出版社,
2016:35.
[14] 胡思源,钟成梁,杨娜.关于儿童中药新药临床试验设计与评价特殊性的几点思考[J].中医杂志,2013,54(9):806-808.
(收稿日期:2022-10-10) (修回日期:2023-08-21;编辑:季巍巍)