当前位置:文档之家› 甘蔗MYB2转录因子的电子克隆和生物信息学分析

甘蔗MYB2转录因子的电子克隆和生物信息学分析

第9卷第1期2011年3月生物信息学China Journal of Bioinformatics Vol.9No.1Mar.,2011收稿日期:2010-04-29;修回日期:2010-09-06.基金项目:国家948项目(2010-C21)。

作者简介:李国印,男,山东菏泽,硕士研究生E -mail :lyion029@163.com.*通讯作者:许莉萍,女,福建莆田,博士,博导、研究员,E -mail :xlpmail@yahoo.com.cn.doi :10.3969/j.issn.1672-5565.2011.01.006甘蔗MYB2转录因子的电子克隆和生物信息学分析李国印,阙友雄,许莉萍*,郭晋隆,闫学兵,陈如凯(福建农林大学农业部甘蔗遗传改良重点开放实验室,福建福州350002)摘要:用电子克隆方法获得甘蔗MYB2基因,采用生物信息学方法,对该基因编码蛋白从氨基酸组成、理化性质、跨膜结构域、疏水性/亲水性、亚细胞定位、高级结构及功能域等方面进行了预测和分析。

结果表明:甘蔗MYB2基因全长991bp ,包含570bp 的ORF ,编码189个氨基酸。

甘蔗MYB2基因包含有MYB 功能域,在序列组成、高级结构及活性位点等方面,与玉米等其它植物的MYB2基因具有高度的相似性。

研究结果为该基因的实验克隆奠定基础。

关键词:甘蔗;MYB2基因;电子克隆;生物信息学中图分类号:Q785文献标识码:A文章编号:1672-5565(2011)-01-024-04Electronic cloning and characterization of MYB 2gene from Saccharum officinarum using bioinformatics toolsLI Guo-yin ,QUE You-xiong ,XU Li-ping *,GUO Jin-long ,YAN Xue-bing ,CHEN Ru-kai(Key Laboratory of Sugarcane Genetic Improvement ,Ministry of Agriculture ,Fujian Agriculture&Forestry University ,Fuzhou 350002,China )Abstract :An novel MYB2gene from Saccharum officinarum was cloned in silico based on the EST seqences from Unigene of NCBI.Some characters of the MYB2encodes amino acid were analyzed and predicted by the tools of bioinformatics in the following aspects ,including the compositon of amino acid sequence ,hydrophobicity or hydro-philicity ,secondary and tertiary structure of protein and funcion.Bioinformatical analysis showed that the full -length of MYB2gene from S.officinarum was 991bp and it contained a complete ORF which encoded 189amino acid.The MYB2gene contained an typical MYB domain and was highly conservative compared with MYB2from several different plant species in sequence compositon ,advanced structure and activity sites.The results will pro-vide the basis for MYB2gene cloning in experiment.Key words :Saccharum officinarum ,MYB2gene ,In silico cloning ,Bioinformatics在植物中首先从玉米中克隆了含有MYB 结构域的转录因子C1基因[1],此后在植物中发现的MYB 相关基因的数量迅速增加。

对其功能的研究表明,植物MYB 转录因子具有广泛的生理功能,几乎参与植物发育和代谢的各个方面,重点是调控环境胁迫,如干旱和病害逆境胁迫、次生代谢调节、激素调控应答及控制细胞分化等。

植物MYB2转录因子是MYB 大家族中一个小的亚族,虽然不同植物的MYB2基因具有不同的生物学功能[2,3],但它们都是在转录水平上调控植物各个阶段的生长发育。

通过突变体及基因敲除技术,已克隆了很多植物MYB 类基因,但在甘蔗MYB 方面研究甚少。

以NCBI 数据库为基础,电子克隆得到甘蔗中编码MYB2的cDNA 序列,利用生物信息学方法,对该基因编码蛋白从氨基酸组成、理化性质、疏水性、亚细胞定位及结构功能等方面进行预测和分析,为后续通过实验手段克隆甘蔗MYB2基因和基因功能研究奠定基础。

1材料和方法1.1电子克隆获得新基因序列以玉米(Zea mays)MYB2转录因子基因(Gene Id:732760)作为探针,利用NCBI中的tblastn工具,搜索甘蔗EST数据库,得到具有同源性的甘蔗EST 序列,在拼接的基础上,以拼接好的EST拼接群(Contig)为新探针,在甘蔗EST数据库里重新搜索,直到没有新的甘蔗EST可供拼接为止。

将人工拼接完成的新基因序列在非冗余数据库中进行搜索,确认为新基因序列。

1.2生物信息学分析核酸及氨基酸序列组成分析、理化性质分析、开放阅读框(open reading frame,ORF)的查找和翻译,利用DNAstar软件及Prot-Param、pI/Mw、ORF Finder等在线工具进行;核酸和氨基酸序列的同源性比对及多序列比对利用Blast和Clustal W在线工具完成;亲水性/疏水性的分析利用在线工具ProtScale完成;蛋白质二级及三级结构的预测利用SOPMA和ESyPred3D等在线工具完成[5,6]。

2结果与分析2.1新基因的识别以玉米(Zea mays)MYB2转录因子基因(Gene Id:732760)作为探针,利用NCBI中的甘蔗EST数据库进行BLAST搜索,得到两个高度同源的EST 序列CA168157和CA207162。

进一步通过DNAstar 进行拼接,获得一个全长为991bp的cDNA序列。

通过ORF Finder分析可知,该cDNA序列包含570 bp的完整开放阅读框,编码189个氨基酸,见图1。

图1电子克隆获得的甘蔗MYB2基因cDNA序列及其推导的氨基酸序列(*表示终止密码子)Fig.1The nucletide acid sequence and deduced aminoacid sequence for MYB2Gene of S.officinarum obtainedby in silico cloning Stop codon is indicated by asterisk(*)2.2甘蔗MYB2基因编码氨基酸的一级结构预测经预测,甘蔗MYB2基因编码氨基酸的一级结构如下:编码的氨基酸数:189等电点(PI):8.88分子量(MW):21144.1负电荷残基(Asp+Glu):20正电荷残基(Arg+Lys):24分子式:C926H1480N280O272S8不稳定系数(II):43.49平均疏水性(GRAVY):-0.436脂肪系数(AI):88.362.3甘蔗MYB2信号肽预测和分析采用SignalP3.0Server预测甘蔗MYB2的信号肽,结果如图2。

根据图2的预测结果,MYB2基因所编码的蛋白不存在信号肽,为非分泌蛋白,该蛋白在细胞质中合成后,不进行蛋白转运。

图2甘蔗MYB2信号肽预测Fig.2The Signal P-NN prediction for MYB2of S.officinarum注:C score:原始剪切位点的分值;S score:信号肽的分值;Y score:综合剪切位点的分值2.4甘蔗MYB2蛋白疏水性/亲水性分析用ProtScale对甘蔗MYB2基因编码的氨基酸序列的疏水性/亲水性进行预测,结果如图3。

图3甘蔗MYB2氨基酸疏水性/亲水性进行预测Fig.3Predicted hydrophobicity/hydrophilicity of the sequence of MYB2deduced amino acid from S.officinarum52第1期李国印,等:甘蔗MYB2转录因子的电子克隆和生物信息学分析图3显示,多肽链的第181号的亮氨酸基(Leu)具有最高的分值2.256,疏水性最强;第16号的甘氨酸(Gly)具有最低的分值-2.45,其次是第103号的酪氨酸(Tyr),为-2.18,均属于亲水性氨基酸。

进一步比较玉米(Gene Id:732760)、小麦(GeneID:543160)和拟南芥(GeneID:819332)中的MYB2多肽链的亲水性和疏水性,其结果均显示亲水特性。

由此预测甘蔗MYB2蛋白属于亲水性蛋白。

2.5甘蔗MYB2蛋白的亚细胞定位通过软件psort预测,结果显示定位在细胞膜的可能性最大,为95.5%,而定位在细胞质和细胞壁的可能性分别只有3.2%和1.2%,所以,推测甘蔗MYB2蛋白是定位于细胞膜。

2.6甘蔗MYB2蛋白的二级结构预测分析通过SOPMA方法,对甘蔗MYB2蛋白二级结构进行预测,结果如图4。

该蛋白二级结构预测的分析结果见表1。

可以看出,α螺旋占的比例最高,为44.97%,其次是无规则卷曲,而β折叠和延伸链所占的比例低,分别只有9.52%和5.29%。

)图4预测的甘蔗MYB2蛋白二级结构Fig.4Predicted secondary structure of MYB2protein from S.officinarum注:Helix:Alpha helix(α螺旋)Sheet:Extended strand(延伸链)Turn:Beta turn(β折叠)Coil:Random coil(无规则卷曲)表1甘蔗MYB2蛋白的二级结构预测分析Table1The analysis of secondary structure predictionof MYB2protein from S.officinarum二级结构类型氨基酸残基数百分比α螺旋Alpha helix8544.97%延伸链Extended strand105.29%β折叠Beta turn189.52%无规则卷曲Random coil7640.21%2.7甘蔗MYB2蛋白结构域分析及功能预测使用NCBI的CDD(Conserved Domain Database)数据库,对甘蔗MYB2基因全长序列中可能有的蛋白功能结构域进行预测的结果如图5。

相关主题