ACTA Scientiarum Naturalium Universitatis Pekinensis
具有热鲁棒性的适应性基因调控网络
刘明 王宏利†
摘要 通过对三节点基因调控网络的枚举、参数空间的随机采样以及动力学模拟, 找到具有热鲁棒性(即温度补偿)的适应性基因转录调控网络, 对其进行结构分析表明, 存在3种最基本的结构可以实现具有热鲁棒性的适应性动力学功能, 复杂的适应性网络都以此3种网络为核心骨架。为了考察三节点适应性网络的适应性对网络动力学中各参数改变的敏感度, 计算了各参数相应的控制系数。对控制系数的聚类分析表明, 三节点功能网络实现热鲁棒的机制为温度隔离, 即尽管网络中所有的速率参数都依赖于温度, 但仅输出节点的生成和降解速率明显偏离0且具有相反的符号, 大多数热鲁棒适应性都通过输出节点的拮抗平衡调节来实现。关键词 适应性; 功能与拓补; 转录网络; 温度补偿
细胞中的生化反应无时无刻不受环境温度的影响, 温度是影响生物生存和繁殖的重要因素之一。生物功能对环境扰动的鲁棒性, 特别是对温度变化的鲁棒性(即热鲁棒性), 对于生物系统正常功能的实现具有重要意义。目前已经有很多关于生物功能的热鲁棒性的研究, 如生物昼夜节律(即生物钟)的温度补偿[1–2]、生物网络中稳态通量的热稳定性[3–5]以及振荡网络的振荡周期温度补偿[6]。热鲁棒性的
另外一个重要例子是适应性功能的温度补偿, 即当温度变化时, 适应性功能的稳态值不随温度发生变化。适应性指一个系统在外界信号作用下做出暂态响应后, 恢复到刺激之前水平的动力学行为。热鲁棒性是生物组织和细胞中普遍存在的动力学功能,如细胞内的信号转导[7]、神经元活动的适应性[8]、稳态功能的适应性[9]以及大肠杆菌的趋化性[10]。尽管已经有一些关于适应性功能的热鲁棒性的实验研
究, 例如大肠杆菌的趋化性[11]和果蝇发育过程中的信号传导[12], 但相关研究非常有限。
本文以基因调控网络为例, 研究三节点基因网络中的热鲁棒适应性。通常情况下, 网络动力学功能与网络的拓扑结构具有关联性[13–14], 寻找特定动力学功能相对应的网络拓扑结构对于了解复杂的生
[15–16]物学网络以及合成生物学具有重要意义 。为找出具有热鲁棒性的适应性(thermally robust adaptation, TRA)功能网络的常见拓扑结构, 本文在对三节点基因调控网络枚举的基础上, 对基因网络动力学方程进行规模化的数值模拟研究。通过对热鲁棒适应性网络进行结构分析, 发现存在3种最基本的网络结构可以实现具有热鲁棒性的适应性功能, 复杂的功能网络通常以此3种网络为核心骨架。对控制系数的聚类分析表明, 三节点功能网络实现热鲁棒性(即温度补偿)的机制为温度隔离, 即尽管网络中所有的速率参数都依赖于温度, 但仅输出节点的生成和降解速率明显偏离0且具有相反的符号, 大多数热鲁棒适应性都通过输出节点的拮抗平衡调节来实现。
1 方法
具有适应性功能的网络至少包含3个节点[17],因此本文选择三节点转录调控网络作为研究对象。为了实现对所有三节点基因转录调控网络拓补结构的枚举, 我们考虑了3个节点之间所有9种可能的转录调控关系, 两两节点之间有激活、抑制或没有调控3种关系。如图1(a)所示, 每个网络具有输入节点A、中间节点B和输出节点C, 节点之间的连接方式代表转录调控作用。三节点的基因调控网络共有 19683种可能的网络拓扑。为了确保网络是连通的, 要求输入节点A必须直接或间接与输出节点C相连接。因此, 可能的拓扑结构总数为16038 个。
为了描述转录调控网络的动力学行为, 采用常微分方程模型[2]。网络中每个节点代表的某基因转录翻译后, 蛋白浓度的动力学方程分为表达速率和降解速率两部分。表达速率采用 Hill 函数形式的输入函数, 降解速率与被降解蛋白的浓度成正比。以网络中的节点i为例, 若节点j和k的产物分别促进和抑制节点i的表达, 则节点i表达产物的浓度 满足以下微分动力学方程:
其中, x 代表节点i的转录翻译产物的浓度,为最
i大转录速率, i为降解速率。Kj 和 KK为转录因子j和 k的解离常数。
特别地, 对于输入节点A, 输入信号I通过直接与输入节点A的转录速率相乘进入节点A的动力学方程。当网络中有多个转录节点调控同一节点时, 选择“OR”的逻辑形式。例如, 在式(1)中,节点j和 k的产物分别对节点i的转录起促进作用 xjk KKK 和抑制作用 , 它们通过加和的 xj xk j k形式调控节点 i 的表达。
为了考虑模型中参数的影响, 我们根据文献[18–19]中对基因转录的温度依赖性的研究结果, 假定表达速率vi 和降解速率i 均按照 Arrhenius 定律的形式随温度变化:
E v Ae
RT , (2)其中, E是与速率v相对应的活化能。参数A, R和T分别为指数前因子、气体普适常数和开尔文温度。本文温度变化范围为288~308 K, 在该区间内对均匀分布的5个温度下的动力学行为进行研究。Hill函数中的解离常数K为解离速率与结合速率的比值, 它们都与温度有关, 为了简化计算, 模型中阈值K不随温度变化。由于转录和翻译对温度的依赖关系比较复杂, 用 Arrhenius定律描述基因表达和蛋白降解随温度的变化是一种理想化的近似。为了通过数值计算确定一个网络结构在某组参数下是否具有适应性, 定义两个参数: 敏感度s和精确度p, 如图1(b)所示。敏感度衡量网络受到外界信号刺激后响应的敏感性, 精确度衡量系统的输出恢复到信号刺激之前的程度或适应的准确性[13]。一个系统的动力学响应如果满足敏感度大于20%且精确度大于100, 则从数值上可以判定为具有适应性。本文中, 如果动力学响应在[288 K, 308 K]都满足以上适应性的条件, 并且温度变化引起的输出变化的比例小于5% (e<5%), 则判定该适应性具有热稳定性或温度补偿性, 即 TRA 特性。
为了较全面地了解一个网络结构在不同参数下实现适应性功能的难易程度, 用拉丁超立方抽样方法对参数空间随机采样。每个速率参数采样的范围均为 0.001~100 a.u, 活化能E的采样范围为50~80 kj/mol。对于每个枚举的网络拓补, 我们随机抽取10000组参数[20]。引进 Q值和q值近似地衡量一个网络结构实现适应性功能和 TRA 功能的鲁棒性。在 10000组参数中, 在固定温度288 K下可以实现适应性功能的参数组的数目, 记为Q值; 对于可以实现适应性的Q组参数, 在[288 K, 308 K]区间的不同温度下依然具有适应性的参数组的数目记为q值, 显然Q q。
2 结果
采用以上方法, 从16038个网络结构中共筛选出122个TRA功能网络, 它们在10000组参数中都至少在一组参数下具有TRA功能。图2(a)为这些适应性网络在Q-q空间的分布, 图2(b)为TRA网络在q 值和网络边数空间的分布。图2(b)表明, 所有TRA功能网络至少包含3条边, 并且鲁棒性比较好的网络(q>3)的边数在 3~7 之间。图2(b)中下方的小圆点对应具有3条边的最简单的网络结构, 它们是可以实现TRA功能的最简单的网络, 共有3个(图中显示两个点, 对应3个网络, 其中两个网络由于q值相同而重合), 称为TRA模体(TRA motif)。这 3种TRA模体在结构上是3种非一致前馈网络, 其控制
节点可以是比例节点或反比例节点[7]。
这 3种 TRA功能模体概括了TRA网络的结构特点, 结构更复杂的TRA功能网络基本上都以这3种最简单的功能模体为骨架。如果一个TRA网络包含 a, b和 c这3种结构中的一种, 则归为对应的类, 如果不包含3种中的任何一种, 则归为“other”类。图3为 122种TRA功能网络在3种非一致前馈TRA功能模体中的分布, 纵轴表示对应的motif 在TRA功能网络中出现的频率。可以看出, 具有模体a, b, c结构的TRA网络占绝大多数, 特别是模体a和b所占比例很高, 而仅有小部分功能网络不包含这3种基本模体而具有其他结构。图4为模体a和b在不同温度下的动力学适应性行为, 可以看出, 在不同温度下, 都具有很好的适应性功能。由于输入节点对输出节点的调控关系不同, 两个网络的输出曲线开口正好相反。
理论上, 在外界信号刺激下, 系统输出的稳态值Os不随温度变化, 因此实现热鲁棒的适应性需满足以下平衡条件:
映系统的输出Os对动力学参数 vi改变的敏感程度。温度直接影响转录调控网络的反应速率, 反应速率又会对转录调控网路的功能产生影响。当网络中某个反应速率对应的控制系数大于或小于0 时,则该速率的增加会对输出Os分别产生促进或抑制作用; 控制系数等于0 时, 该速率的变化不会对Os产生影响。
式(3)中的求和遍历动力学方程中所有的反应速率常数。式(3)表明, 温度补偿的条件在于满足 CE 0, 即每个参数的控制系数(Csi)与其活化si i i能(Ei)的乘积的和为0。活化能的数值都大于0, 正是由于一个网络中不同速率对应的控制系数的数值可以为正, 也可以为负或等于0, 才保证了温度补偿方程(式(3))的成立。根据控制系数的定义, 利用数值计算获得所有122 个 TRA功能网络的控制系数, 并对其进行聚类分析。
TRA功能网络的控制系数Csi的聚类分析如图5所示, 每行代表一个网络所有的控制系数。例如,图中第1列和第2列分别代表对应节点A的转录速率(VAT)和降解速率(VAD)的控制系数。图中的颜色条表示控制系数的大小。对于大多数网络, 聚类结果中输入节点A的控制系数都比较小, 控制系数基本上在0附近, 意味着网络的稳定输出Os受到节点A参数改变的影响比较小。同样地, B节点对应蛋白的降解速率相关的控制系数普遍接近于0, 仅在部分网络中B节点的翻译生成速率常数的控制系数为负, 随温度的升高显著降低系统的输出。从图5可以看出, 对输出影响最大的是输出节点C。节点C动力学方程中的生成速率常数的控制系数为正, 且明显偏离0, 而降解速率常数的控制系数为绝对值相对较大的负数。从控制系数的聚类来看, 这些TRA功能网络的热鲁棒适应性主要通过输出节点调节。通过选择适当的活化能, 使得式(3)的平衡条件得到满足。
3 讨论
为了探究适应性功能的热鲁棒性, 本文从所有可能的拓扑结构中筛选出具有TRA功能的三节点转录调控网络。通过分析这些网络的拓扑结构, 我们发现3 种 TRA功能模体, 即 3种非一致前馈网络a, b和c。绝大多数TRA功能网络都以这3种模
体为骨架构成。根据温度补偿条件, 适应性功能的温度补偿主要取决于两个因素: 活化能与控制系数。活化能取决于实际蛋白质结构, 由于不同反应速率对温度的敏感度不同, 所以在计算中对活化能随机取值。对于反应速率常数(包括翻译生成速率常数和降解速率常数), 本文假定它们随温度的变化遵循 Arrhenius定律。控制系数的正负一般与网络拓扑结构相关。在TRA功能网络的控制系数的聚类中, 我们发现网络的控制系数可以为正, 也可以为负或接近 0, 这保证了只要适当地选择活化能,就可以使得温度补偿的条件得到满足。另外, 聚类结果表明输出特征值Os主要取决于输出节点的反应速率, 基本上不依赖于输入节点。本文仅对“OR”逻辑调控关系做了计算, 其模型比较理想化, 但结果对于理解适应性的温度补偿机制有一定的意义,特别是可以为实验合成热鲁棒性适应性网络提供理论基础。
参考文献
[1] Ruoff P, Loros J J, Dunlap J C. The relationship between Frq-protein stability and temperature compensation in the Neurospora circadian clock. Proceedings of the National Academy of Sciences, 2005, 102(49): 17681–17686 [2] Tseng Y Y, Hunt S M, Heintzen C, et al. Comprehensive modelling of the Neurospora circadian clock and its temperature compensation. PLOS Comput Biol, 2012, 8(3): 1002437–1002449 [3] Hazel J R, Prosser C L. Molecular mechanisms of temperature compensation in poikilotherms. Physiological Reviews, 1974, 54(3): 620–677 [4] Zakhartsev M V, De Wachter B, Sartoris F J, et al. Thermal physiology of the common eelpout (Zoarces viviparus). Journal of Comparative Physiology B, 2003, 173(5): 365–378 [5] Ruoff P, Zakhartsev M, Westerhoff H V. Temperature compensation through systems biology. FEBS J, 2007, 274(4): 940–950 [6] Wu L, Ouyang Q, Wang H. Robust network topologies for generating oscillations with temperature-independent periods. PLOS One, 2017, 12(2): 63–81 [7] Shi W, Ma W, Xiong L, et al. Adaptation with transcriptional regulation. Scientific Reports, 2017, 7(1): 339–349
[8] Cao L H, Jing B Y, Yang D, et al. Distinct signaling of Drosophila chemoreceptors in olfactory sensory neurons. Proceedings of the National Academy of Sciences, 2016, 113(7): 902–911 [9] El-samad H, Goff J P, Khammash M. Calcium homeostasis and parturient hypocalcemia: an integral feedback perspective. Journal of Theoretical Biology, 2002, 214(1): 17–29 [10] Gomez-marin A, Duistermars B J, Frye M A, et al. Mechanisms of odor-tracking: multiple sensors for enhanced perception and behavior. Front Cell Neurosci, 2010, 4: Article 6 [11] Oleksiuk O, Jakovljevic V, Vladimirov N, et al. Thermal Robustness of Signaling in Bacterial Chemotaxis. Cell, 2011, 145(2): 312–321 [12] Shimizu H, Woodcock S A, Wilkin M B, et al. Compensatory flux changes within an endocytic trafficking network maintain thermal robustness of Notch signaling. Cell, 2014, 157(5): 1160–1174 [13] Ma W, Trusina A, El-samad H, et al. Defining network topologies that can achieve biochemical adaptation. Cell, 2009, 138(4): 760–773 [14] Yan L, Ouyang Q, Wang H. Dose-response aligned circuits in signaling systems. PLOS One, 2012, 7(4): 34727–34736 [15] Wagner A. Circuit topology and the evolution of robustness in two-gene circadian oscillators. Proceedings of the National Academy of Sciences, 2005, 102(33): 11775–11780 [16] Lim W A, Lee C M, Tang C. Design principles of regulatory networks: searching for the molecular algorithms of the cell. Molecular Cell, 2013, 49(2): 202–212 [17] Ma W, Lai L, Ouyang Q, et al. Robustness and modular design of the Drosophila segment polarity network. Molecular Systems Biology, 2006, 2(1): Article 70 [18] Mejia Y X, Mao H, Forde N R, et al. Thermal probing of E. coli RNA polymerase off-pathway mechanisms. J Mol Biol, 2008, 382(3): 628–637 [19] Ruoff P, Christensen M K, Wolf J, et al. Temperature dependency and temperature compensation in a model of yeast glycolytic oscillations. Biophysical Chemistry, 2003, 106(2): 179–192 [20] Iman R L. Latin hypercube sampling. Chichester: American Cancer Society, 2014