毛果杨PP2C基因家族生物信息学分析摘要:蛋白磷酸酯酶2C(PP2C)是蛋白磷酸酯酶中的一大类,广泛参与逆境信号的传递过程。
本实验采用比较基因组学的方法,利用已知的拟南芥PP2C蛋白序列为检索序列,在全基因组水平上搜索毛果杨的PP2C基因的同源序列。
最终确定了毛果杨45个PP2C候选基因。
对同源序列作进一步的多序列联配、ESTs、MEME和系统发生表达分析。
关键词:毛果杨比较基因组学基因家族Abstract: Protein phosphatase 2C (PP2C) is a protein phosphatase in a large class, the broad participation of adversity signal transmission process. In this study, we searched the homologous sequence from Populus trichocarpa protein database based on the complete genome by using comparative genomics methods and taking the Arabidopsis thaliana PP2C protein which has been isolated as the retrieval sequence. The results showed that 45 PP2C-like protein were identified from Populus trichocarpa. Further, we also analyzed the sequence alignment, MEME, EST and phylogenetic.Keywords: Populus trichocarpa comparative genomics genne family真核生物基因组中,编码蛋白磷脂酶的基因远远少于蛋白激酶,一般只有蛋白激酶基因数的四分之一至三分之一。
在过去的研究中,蛋白质可逆磷酸化研究的重点主要针对蛋白激酶,不过,现在越来越多的研究显示,在信号转导中,蛋白磷酸酶和蛋白激酶同样重要[1]。
根据底物蛋白分子上去磷酸化的氨基酸残基的种类,PP主要分为三个家族:酪氨酸蛋白磷酸酶(protein tyrosine phosphatases, PTPs)、丝氨酸蛋白磷酸酶(protein serine phosphatases, PPPs)和双特异性蛋白磷酸酶(dual specificity phosphatases, PSPs)。
根据酶对底物选择的特异性和对抑制剂的敏感程度,PPPs分为PP1和PP2。
根据亚基的结构、二价离子的依赖性和底物特异性,PP2又可进一步分为PP2A、PP2B和PP2C[2]。
大量研究表明,PP2A在进化过程中,高度保守且广泛表达。
PP2B是由催化亚基A和调节亚基B构成的二聚体,也是唯一受Ca2+/CaM调节的丝氨酸蛋白磷酸酶,在介导Ca2+信号到细胞应答中发挥了重要作用。
在所有PSPs的亚类中,只有PP2C没有调控亚基,是一种单体蛋白磷酸酶,活性依赖于Mg2+或Mn2+[4]。
PP2C与其他类型的PPP类蛋白磷酸酶相比,没有较明显的氨基酸序列同源性,但是蛋白质三维结构的相似性却揭示这些蛋白磷酸酶可能拥有相似的催化机制或相同的催化底物。
PP2C类蛋白磷酸酶的一个重要的结构特征是在其催化区域内含有11个保守的结构亚区[3]。
与哺乳动物PP2Cs相比,植物PP2Cs具有独特的结构模式,即植物中多数PP2C类磷酸酶C端具有保守的催化区域,而N端却是保守性不强、长度不一的延伸区域,在这些延伸区域内,含有与胞内信号相关的序列包括跨膜区域和激酶互作区域等,从而赋予了PP2C 不同的功能[1]。
蛋白磷酸酶结构的复杂性是功能广泛性的基础。
随着植物中越来越多的蛋白磷酸酶基因及其相关蛋白的分离、纯化与鉴定,以及基因特性与生理生化的深入研究,其众多的功能也陆续的被确定。
迄今为止,蛋白磷酸酶已经被证实与植物的生长发育、信号转导、细胞周期、渗透胁迫以及活性氧胁迫等各种抗逆性反应相关联。
如今,毛果杨的全基因组测序已经完成,数据库Populus trichocarpa v1.1(/Poptrl_1/Poptrl_1.home.html)公布了全部序列。
此后,在第一测序的基础上,进行了第二次补充测序。
毛果杨全基因组最新数据已经包含在数据库Phytozome v7.0(/poplar)。
本实验运用生物信息学方法对毛果杨的PP2C基因家族进行了初步分析鉴定[5]。
1 材料与方法1.1数据库的搜索根据拟南芥只已分离出的PP2C基因及其编码的蛋白质序列,在NCBI(美国国立生物技术信息中心,National Center for Biotechnology Information, /)中通过blastp检索毛果杨无荣誉蛋白质数据库,E≤10-26的序列被认为是候选蛋白。
利用Blastn 程序将获得的候选蛋白与拟南芥的PP2C基因作进一步的匹配,采用默认参数,取E≤10-10的击中项为最终的候选蛋白,由相应的程序和索引文件提取所有符合条件的蛋白序列,构建列表。
最后,从相应的数据库中下载最终确认的候选蛋白所对应的CDS序列[5]。
1.2序列联配分析与系统发生树的构建利用Clustal W软件对搜索到的蛋白质序列进行多序列联配分析。
以序列联配结果为基础,用MEGA3.1软件生成毛果杨PP2C蛋白的系统发生树。
进化树的生成采用邻接法(Neighbor-joining method)。
具体参数设置Test of Phylogeny: Bootstrap method; Replications: 1000; Method: Poisson model; Gaps: Pairwise deletion; Rates among Sites: Uniform rates。
其它为默认参数[7]。
1.3 PP2C的motif分析毛果杨PP2C类型基因的预测motif分析通过MEME (/meme/cgi-bin/meme.cgi)在线分析[14]。
1.4 PP2C的EST分析毛果杨PP2C基因家族的EST分析是通过NCBI,在Expressed sequence tags(EST)数据库中进行核苷酸比对,统计比对结果的组织类型的信息,进而与预测每个基因在不同组织类型中的表达情况。
2 结果与分析2.1 毛果杨PP2C的挖掘根据拟南芥PP2C基因编码的蛋白质检索出毛果杨PP2C基因家族蛋白,之后去冗余共得到45条毛果杨候选PP2C氨基酸序列,都具有PP2C保守区域。
从表可知,毛果杨的PP2C 基因分布于第1至18号染色体上,除四号染色体上无表达基因外,其余都有所表达。
从基因结构看,毛果杨内含子数目在2-10之间变化,并不包含没有内含子的基因,说明植物的PP2C基因,进化过程中没有发生内含子的插入和缺失事件。
详细信息如表1所示。
表1 毛果杨的PP2C候选蛋白及匹配EST的数量Table 1 The PP2C candidate proteins and the hits number of EST in Populus trichocarpa基因Gene 位点Locus蛋白质长度(aa)Protein length(aa)染色体Chromosome匹配EST数量The hits number of EST内含子IntronPPTP2C-1 EEF02439 397 LGX 119 3 PTPP2C-2 EEE88105 385 LGIX 118 4 PTPP2C-3 EEE84651 392 LGI 0 3 PTPP2C-4 ERP66114 411 LGI 0 3 PTPP2C-5 EEF05571 334 LGXV 122 3 PTPP2C-6 EEE96607 370 LGXII 120 2 PTPP2C-7 EEE79084 546 LGIII 147 3 PTPP2C-8 ERP66113 302 LGI 0 3 PTPP2C-9 EEE93007 548 LGVI 120 2 PTPP2C-10 EEF03306 551 LGXVIII 109 3 PTPP2C-11 EEE82783 388 LGI 0 3 PTPP2C-12 ERP49654 578 LGXVIII 109 3 PTPP2C-13 ERP59565 229 LGVI 120 2 PTPP2C-14 EEF05989 289 LGXV 122 3 PTPP2C-15 ERP52444 305 LGXV 122 3 PTPP2C-16 EEE97078 286 LGXII 120 2 PTPP2C-17 EEF05572 351 LGXV 122 8 PTPP2C-18 EEE96604 355 LGXII 120 8 PTPP2C-19 EEE94467 276 LGV 144 7 PTPP2C-20 ERP61405 273 LGV 144 7 PTPP2C-21 EEF02923 292 LGXVIII 109 8 PTPP2C-22 EEE92243 292 LGVI 120 8PTPP2C-23 ERP49572 262 LGXVIII 109 8 PTPP2C-24 EEE83289 392 LGI 0 3 PTPP2C-25 ERP54886 255 LGXII 120 2 PTPP2C-26 EEE87942 416 LGIX 118 3 PTPP2C-27 EEF02373 389 LGX 119 3 PTPP2C-28 EEF01832 397 LGX 119 5 PTPP2C-29 ERP65062 359 LGI 0 10 PTPP2C-30 EEE99269 397 LGXIV 131 3 PTPP2C-31 EEE97500 282 LGXI 159 4 PTPP2C-32 EEE88603 380 LGVIII 126 3 PTPP2C-33 ERP51920 284 LGXV 122 8 PTPP2C-34 ERP50526 313 LGXVII 189 4 PTPP2C-35 EEE79713 359 LGIII 147 10 PTPP2C-36 EEE92161 382 LGVI 120 3 PTPP2C-37 EEF04978 661 LGXVI 139 11 PTPP2C-38 EEF02837 380 LGXVIII 109 3 PTPP2C-39 EEF03484 358 LGXVIII 109 10 PTPP2C-40 EEE93202 358 LGVI 109 10 PTPP2C-41 EEE94216 381 LGV 144 3 PTPP2C-42 ERP53974 446 LGXIII 130 4 PTPP2C-43 EEE80809 389 LGII 112 3 PTPP2C-44 EEF03734 338 LGXVIII 109 4 PTPP2C-45 ERP58376 384 LGVII 117 4 注:毛果杨染色体构成LG_2.2 毛果杨PP2C蛋白的系统发生分析为了对毛果杨PP2C蛋白的功能和特性作进一步的了解,本实验对预测的毛果杨45个PP2C基因与已经鉴定出的拟南芥的所有蛋白序列的进化关系进行了评估。