CJI (Traditional Chinese Medicine)

“基因-体质-疾病”关联模式下4种中医体­质差异表达基因富集分­析

-

孙占东,刘嘉,曾庆琪江苏卫生健康职­业学院,江苏 南京 211800

摘要:目的 从系统生物学角度挖掘­基因与4种中医体质(湿热质、血瘀质、特禀质、痰湿质)的相关性,探究体质形成及体病相­关的微观机理,为体质分类及体病相关­理论提供生物学依据。方法 计算机检索中国知识资­源总库(CNKI)、中国学术期刊数据库(万方数据)建库至2016 年 12 月 31日收录的中医体质­与基因表达相关文献。收集4种中医体质的差­异表达基因,分别采用DAVID数­据库进行富集分析,包括基因组织富集分析、疾病分析、GO 分析及通路分析。对 DAVID 数据库分析结果进行下­载整理。结果 4 种中医体质在基因层次­上存在较大差异,每种体质显著富集的基­因功能、活性、通路、相关疾病、表达位置等均有特异性。基因表达模式不同,导致体质对疾病易感性­及倾向性的差异。结论 本研究提示中医体质形­成的实质是基因表达模­式的差异,病理变化由其改变所致。

关键词:中医体质;体病相关;基因;富集分析

DOI:10.3969/j.issn.1005-5304.2018.09.022

中图分类号:R2-05;R229 文献标识码:A 文章编号:1005-5304(2018)09-0091-05

Enrichment Analysis on Differenti­ally Expressed Genes in Four TCM Constituti­ons within “Gene-constituti­on-disease” Relevance Mode

SUN Zhan-dong, LIU Jia, ZENG Qing-qi

Jiangsu Health Vocational College, Nanjing 211800, China

Abstract: Objective To dig the correlatio­n between genes and four TCM constituti­ons (phlegm-dampness, blood stasis, allergy, and dampness-heat); To analyze microscopi­c mechanism of constituti­on formed and constituti­on-disease correlatio­n; To provide biological basis for TCM constituti­on classifica­tion and constituti­on-disease correlatio­n theory. Methods Literature about TCM constituti­ons and gene expression­s in CNKI and Wanfang Database were retrieved by computers from the establishm­ent of database to 31, December 2016. Differenti­ally expressed genes of four TCM constituti­ons were collected, and DAVID database was used for enrichment analysis, including gene tissue enrichment analysis, disease analysis, GO analysis, and pathway analysis. The results of DAVID database analysis were downloaded and analyzed. Results Four TCM constituti­ons had difference­s in gene level, and each constituti­on had the specificit­y in significan­tly enriched gene function, activity, pathways, related diseases, and expression locations. Different patterns of gene expression led to the constituti­on difference­s in disease susceptibi­lity and tendency. Conclusion The essence of TCM constituti­on formation is the change of gene expression patterns, and the pathologic­al changes are also caused by the change.

Keywords: TCM constituti­ons; constituti­on-disease correlatio­n; gene; enrichment analysis

基金项目:江苏省高校青蓝工程项­目(2017年);浦口区社会

事业科技项目(S2016-04);江苏卫生健康职业学院­院级课题

项目(2018 年)

通讯作者:曾庆琪,E-mail:zengqq111@126.com

随着人类疾病谱的变化,其复杂性、多样性促使个体化医疗­模式成为新浪潮。中医体质学说是以研究­人类各个体质特征,以个体为对象,指导疾病的预防、治疗以及养生康复的中­医基础理论,与个体化医疗模式密切­相关。王琦[1]提出的体质九分法被普­遍认可。

体质形成的微观机制是­中医体质学研究必须面­临的

科学问题[2]。体质的形成具备个体性­的物质基础,每种体质都有其特定的­基因表达模式,体质宏观的差异

应源于微观基因表达的­差异[3]。因此,从分子水平探究体质形­成的生物学机理十分必­要。

目前中医体质的基因组­学研究表明,各种偏颇质

在基因表达上普遍存在­失调[4]。基因直接或间接决定了­中医体质对某些病症种­类的易罹性及倾向性,从而

导致个体在病性、病位、病程、病变等方面的差异[5]。通过研究体质的基因表­达基础,即体质与基因、基因与疾病的相关性,预测体质与疾病的相关­性,可为中医体质学“体病相关”理论提供生物学依据。

基因功能富集分析又称­为功能聚类分析,其原理为超几何分布,最终获得一组基因集在­某个功能分类中的显著­性条目,这些条目是与实验目的­有显著关联的、靶向性的基因功能类别,即导致样本差异最重要

的功能信息[6]。本研究整合 4种体质(湿热质、血瘀质、特禀质、痰湿质)的基因表达数据,采用系统生物学方法,对各体质的差异表达基­因进行富集分析。以期从分子水平阐述中­医体质易感疾病的原因、性质、部位及其内在联系,为调体防病提供参考。1 资料与方法

1.1 数据来源及筛选计算机­检索中国知识资源总库(CNKI)、中国学术期刊数据库(万方数据),以主题词“体质”“基因表达谱”进行模糊检索,检索范围均从建库至 2016年 12 月 31日。对结果逐一仔细阅读,同时满足下列标准予纳­入:①实验样本符合9种体质­分类及判定标

准[1]。②以偏颇体质为实验样本,平和体质为对照样本,样本量不小于 3。③取样于人体外周血液且­应用芯片技术检测基因­表达谱。④文献结果中明确报道偏­颇质相对于平和质样本­的差异表达基因。

1.2 数据提取

对文献中4种偏颇体质­差异表达的基因进行提­取收集,以基因列表(gene list)形式分别保存于独立

的文本文件中,基因列表格式:gene1,gene2,gene3...。如某种体质差异表达基­因结果在文献中以芯片 ID 形式报道,需对芯片 ID 进行转换,找出该芯片参考资料,将芯片 ID 转化为对应的正式基因­符(official gene symbol),如 ID(211300_s_at)→gene symbol(TP53)。最后对所获得的每种体­质差异表达基因去冗处­理。

1.3 数据分析

采用 DAVID 数据库(https://david.ncifcrf.gov/)对收集的 4 种体质差异表达基因进­行富集分析。 DAVID 为生物信息整合数据库,知识库丰富且易操作,可对输入的基因集进行“一键式”系统综合的生物功能注­释分析,目前被引用超过26 000 次。将提取的基因列表文件­输入数据库,在输出结果中可直接获­得体质差异表达基因的­组织、疾病、GO ( gene ontology)、生物通路等富集信息,其输出结果可另存为文­本格式。对下载结果进一步筛选,当P<0.05 时,富集结果有统计学意义,被作为该种体质显著性­的富

集条目[7]。利用数据库集成的分析­功能,可明确基因功能、特性、表达位置等信息。

组织富集分析。对于给定的体质差异表­达基因集,组织富集分析可快速识­别其在人体组织中显著­表达的位置,用于分析细胞、组织、器官与体质症候表现的­关系。

疾病富集分析。基于 OMIM 数据库收录的人类遗传­疾病基因,将体质差异表达基因集­作为输入数据,通过疾病富集分析可获­得对应的疾病信息,为进一步体病相关研究­提供依据。

GO 富集分析。GO 富集分析分为“molecular function”(分子功能)、“biological process”(生物过程)、“cellular component”(细胞组成)3 部分,通过该项分析可找出在­统计上显著富集的GO­条目,寻找影响体质形成的基­因功能。

生物通路富集分析。利用KEGG数据库,获取体质差异表达基因­参与的生物通路,分析生物通路的功能与­体质形成的相关性,探究体质形成的微观机­制。2 结果2.1 中医体质差异表达基因­数据经检索,获得文献 CNKI 107 篇、万方数据 195篇。阅读筛选后,进行4种体质差异基因­数据提取、整理,获得4种中医体质差异­表达基因集、文献及实验数据见表1。

2.2 4种中医体质差异表达­基因组织富集分析组织­富集可对基因表达位置­进行定位研究,分析

细胞、组织、器官与体质症候表现的­关系。4 种中医体质差异表达基­因在人体分布位置存在­较大差异。特禀质差异表达基因富­集范围较广,多分布于脾脏、外周血淋巴细胞、自然杀伤细胞、血小板等免疫及血液系­统,及肝脏、卵巢、胰腺等脏器。湿热质差异表达基因分­布于口腔、肝脏、骨髓、肺等部位,在白细胞、嗜中性粒细胞中也存在。痰湿质差异表达基因的­分布多与生殖器官相关,如子宫、卵巢、胎盘,在上皮细胞与淋巴细胞­中也有分布。血瘀质差异表达基因分­布于骨髓、子宫、T细胞等。差异表达基因信息见图­1。

2.3 4种中医体质差异表达­基因疾病富集分析特禀­体质显著富集得到13­种疾病,其中8种为免

疫系统疾病,2 种与白血病相关;湿热体质富集得到

13种疾病(免疫系统疾病4种、肿瘤4种、口腔疾病

2 种及自然流产);痰湿质富集得到 4 种疾病(肿瘤

2种、无精子症及自身免疫性­疾病);血瘀质富集得到

2 种疾病(糖尿病 1、2 型)。1 型糖尿病被特禀质、血瘀质共同富集,HIV感染被特禀质、湿热质共同富

集。4种体质差异表达基因­疾病富集分析结果见图­2。

2.4 4种中医体质差异表达­基因GO富集分析

差异表达基因GO富集­分析在三个层次上得到­显著富集的注释条目结­果为:湿热质分子功能3条、生物过程 21 条、细胞组成 12条;血瘀质分子功能7条、

不同体质差异表达基因­在生物体内功能、活性及表达位置不同,可能导致体质差异。差异表达基因主要参与­的生物过程方面,湿热质为防御真菌、细菌、病毒反应、免疫反应等,血瘀质为细胞增殖、内吞作用等,特禀质为免疫反应、信号转导、MAPK活性激活、炎症反应等,痰湿质为正向调节 I-kappab 激酶/NF-kappaB 信号、自噬、IL-1 细胞反应、IL-4 负调控等。部分条目被多种体质共­同富集,如蛋白质结合被特禀质、痰湿质、血瘀质共同富集,蛋白激酶结合被特禀质­及血瘀质共同富集,poly(A) RNA结合被痰湿质、血瘀质共同富集,表明多种体质差异表达­基因均参与重要的生物­反应过程,各体质在组学层面存在­内部联系,提示兼具多种体质或体­质间转化的可能。2.5 4种中医体质差异表达­基因生物通路富集分析

分析差异表达基因参与­的生物通路,特禀质富集 生物过程6条、细胞组成5条;特禀质分子功能7 条、生物过程 23条、细胞组成 10条;痰湿质分子功能5条、生物过程10条、细胞组成11条。每种体质富集结果详细­注释条目见图3。 得到 7条生物通路,其中4条(系统性红斑狼疮、抗原处理和表达、T细胞受体信号通路、肿瘤坏死因子信号通路)属免疫系统,提示特禀质免疫系统较­平和质增强。湿热质富集得到4条通­路,其中2条属免疫

疾病通路、2 条与细胞吞噬相关,也展示出免疫活性上调。痰湿质富集得到4条通­路,其中2条属传染性

疾病通路,提示出炎症反应的亢进,1 条与鞘脂代谢

相关,提示与脂类代谢疾病相­关,1 条为破骨细胞分化通路。血瘀质富集得到3 条通路,1条通路与肿瘤

的胆碱代谢相关,1 条通路属磷脂酰肌醇信­号通路,

与钙离子转运相关,1 条与信号转导与细胞能­动性有关。各体质差异表达基因富­集得到的条目不同,但在免疫反应、炎症反应、代谢等方面均表现出较­平和质增强的趋势,所得结果可能为富集生­物通路与体质特征的相­关性及体质形成的微观­机制,通路信息见图4。

3 讨论中医体质学研究各­体质类型的生理、病理特点,分析疾病的反应状态、病变性质和发展趋向,从而指导预防和治疗。然而,中医体质形成的微观机­制尚不明确。本研究挖掘4种体质具­有的特异性遗传物质基­础,揭示不同体质间的微观­基因表达差异。

特禀质多与先天禀赋有­关,也与后天失养相关,此类人群对外界环境适­应能力较差。本研究结果表明,特禀质差异表达基因分­布于免疫及血液系统,与免疫系统疾病高度相­关,多参与免疫反应、信号转导、MAPK活性激活、炎症反应等,与系统性红斑狼疮、抗原处理和表达、T细胞受体信号通路、肿瘤坏死因子信号等免­疫系统通路相关。提示特禀质与免疫系统­和先天遗传疾病关系密­切,符合中医理论。

湿热质因先天不足,久居湿地;或喜食肥甘,长期饮酒,湿热内蕴。此类人群周身乏力、面部痤疮、口干口苦、便秘、尿短赤等。本研究结果表明,湿热质差异表达基因分­布于口腔、肝、肺等易“上火”部位,与肿瘤、免疫系统疾病及口腔病,防御真菌、细菌、病毒反应,免疫反应等密切相关。热邪病位多变,其性上炎;湿邪重浊黏滞,其性趋下,故湿热质易罹患疾病复­杂多样,但主要涉及感染性疾病。

“肥人多痰湿”,痰湿质常表现为嗜睡,喜食辛辣、肥甘厚腻,周身乏力、倦怠、身体沉重、大便黏腻等。本研究结果表明,痰湿质差异表达基因分­布多与生殖器官,肿瘤、无精子症等,正向调节 I-kappab激酶/NF-kappaB 信号、自噬、IL-1 细胞反应、IL-4负调控等,脂类代谢疾病通路及炎­症通路有关。提示痰湿质多与肥胖相­关,符合中医理论。

血瘀质常因情志、饮食、劳逸等内伤致血行不 畅,或因外邪、内伤、气虚、邪热迫血妄行,表现为面色青黯、疼痛、拒按、舌质紫黯等。本研究结果表

,血瘀质和肿瘤发病相关,与血瘀质常致癥瘕积块­的中医理论相符;血瘀质出现磷脂酰肌醇­信号通路变化,涉及钙离子转运,提示与心脑血管疾病相­关。疾病富集提示血瘀质与­糖尿病存在高度的体病­相关性。

综上,不同体质的基因表达模­式存在差异,易患疾病与体质存在高­度相关性。各体质在基因层次有一­定联系,提示兼夹体质存在基因­组学基础。但本研究仅收集了差异­表达基因,未对体质间相关性深入­分析,后续可结合个体体质特­征及基因表达模式进一­步研究。中医体质以整体观为基­础,系统生物学也以整体观­研究生命本质。采用系统生物学方法,可对多种体在蛋白质组­学、代谢组学方面开展研究,体内的生命物质如酶、细胞因子、代谢产物等,对体质形成同样发挥着­重要作用,可进一步印证体质差异­的客观基础。

考文献:

] 王琦.中医体质学[M].北京:人民卫生出版社,2008. ] 王琦.论中医体质研究的 3 个关键问题[J].中医杂志,2006,47(4):

250-252. ] 孙艳.论基因与体质的相关性[J].长春中医药大学学报,2009,25(1):

3-4.

] 王济,李英帅,李玲孺,等.9 种中医体质类型的基因­组学研究[J].中华

中医药杂志,2014,29(12):3871-3873. ] 童福易,赖仁胜,薛博瑜.试论中医体质与疾病的­发生[J].现代中西医

结合杂志,2012,21(10):1128-1130. ] 刘明,王米渠,丁维俊,等.表达谱芯片数据的基因­功能富集分析[J].

生物医学工程学杂志,2010,27(5):1166-1168,1196.

] HUANG D W, SHERMAN B T, LEMPICKI R A. Systematic and integrativ­e analysis of large gene lists using DAVID Bioinforma­tics Resources[J]. Nature Protoc,2009,4(1):44-57.

[8] 周珊珊.湿热体质人群差异表达­基因的筛选及其功能初­探[D].广州:

广州中医药大学,2016.

[9] 田栓磊.血瘀体质理论及其外周­血基因表达谱的研究[D].北京:北京

中医药大学,2009.

[10] 王睿林.过敏体质理论及其外周­血基因表达谱研究[D].北京:北京中

医药大学,2009.

[11] 高京宏.痰湿体质机制及基因表­达谱研究[D].北京:北京中医药大

学,2005.

(收稿日期:2017-06-26)

(修回日期:2017-07-27;编辑:向宇雁)

 ??  ??
 ??  ??
 ??  ?? 图 3 4种中医体质差异表达­基因GO富集分析结果
图 3 4种中医体质差异表达­基因GO富集分析结果
 ??  ??
 ??  ??
 ??  ?? 开放科学(资源服务)标识码(OSID)内含全文PDF和增强­文件
开放科学(资源服务)标识码(OSID)内含全文PDF和增强­文件

Newspapers in Chinese (Simplified)

Newspapers from China