当前位置:文档之家› 生物信息学课程论文.doc

生物信息学课程论文.doc

番茄WRKY26基因的生物信息学分析摘要:番茄(Lyeopersicon 1)是世界上重要的蔬菜作物之一,已经成为蔬菜基因工程研究的模式植物之一。

由于环境污染,气候条件不断恶化,使地球上的生物生存环境遭受到越来越严重的危害,因此番茄非生物抗逆性改良的研究工作就更显得迫切和重要。

已有研究证明WRKY转录因子可参与多种植物抗性反应,WRKY26基因存在于番茄中,其编码的WRKY26转录因子对番茄抗旱性有重要调控作用,研究其生物学功能显得尤为重要。

本文采用生物信息学的方法对已在GenBank 上登录的番茄WRKY26基因的核酸及氨基酸序列、组成成分、同源性比对、编码蛋白质的理化性质、信号肽、跨膜结构域、亲、疏水性、蛋白质结构及功能域等进行预测和推断。

结果表明:该基因的ORF长度为1608bp 且与马铃薯STWRKY8同源性很高,该基因编码的蛋白质分子量为分子量为59624.9,等电点为6.87,为酸性疏水性蛋白质,且不稳定。

该蛋白质无信号肽和跨膜结构域,属于非分泌蛋白质。

蛋白质结构表明该蛋白主要为β转角和无规则卷曲,没有α螺旋。

通过此次研究,希望为今后深入研究该类基因的功能和结构特征提供依据。

关键词:番茄;WRKY26基因;蛋白质功能;同源性前言番茄基因组中,数目众多的转录因子参与植物的生长发育、物质代谢、响应生物和非生物胁迫等多种生物进程。

WRKY基因家族是植物重要的转录因子家族,在抗病信号转导途径中起重要调控作用,因而成为分子植物病理研究领域中的热点。

WRKY转录因子是一类植物所特有的抗逆相关转录因子超家族,在植物生物、非生物胁迫[1]以及植物的生长发育和多种代谢途[2]的调控中起重要作用。

近年来的研究发现,转录因子和抗逆基因会对环境胁迫作出响应。

一个抗逆基因的超表达只能提高植物单一抗性,而一个转录因子基因的超表达能够激活多个下游抗逆基因的表达,从而提高植物综合抗逆能力。

所以与单抗基因相比,转录因子已成为作物改良的研究热点。

尤其是WRKY转录因子,因其可显著地调控植物生物和非生物胁迫,更是备受关注[3]。

WRKY家族中的大部分成员受到水杨酸(SA)、NaCl、低温等刺激后会诱导表达[4-6]。

Q iu等[7]发现OsWRKY45可在病原菌的诱导下表达,并提高转基因拟南芥的抗病性,说明WRKY基因还具有潜在的抗病能力。

现已证明WRKY可参与多种植物抗病反应[8]。

番茄作为重要的模式植物周年生产中常受到高盐、低温、病原菌的影响,其遗传改良越来越受到重视[9]。

所以研究WRKY26基因的生物信息学功能显得尤为重要,可以为转基因番茄等其他遗传操作提供技术储备。

一.基因的查找,在NCBI中查找基因序列mRNA sequence>gi|723709376|ref|XM_004241707.2| PREDICTED: Solanum lycopersicum probable WRKYtranscription factor 26 (LOC101255501), mRNAGTATCTTCTTTCTTTTAATGGCTGCTTCAAGTTTCTCTTTTCCCACTTCATCTTCTTCATTCATGACGACTTCTTT CACCGACCTTCTTGCTTCTGATGATTATCCAACCAAAGGACTTGCTGATAGAATTGCAGAGAGGACTGGTTCTGGA GTTCCTAAATTCAAATCTCTTCCACCTCCTTCACTTCCATTATCGCCTCCTCCTTTTTCGCCTTCCTCTTACTTTG CTATTCCTCCTGGTTTAAGTCCAACTGAACTTTTAGACTCCCCTGTTCTTTTGTCTTCTTCAAACCTTCTTCCATC TCCGACGACTGGGAGTTTTCCATCTCGTGCTTTTAATTGGAAGAGCAGTAGTCATCAGGATGTGAAACAGGAAGAC AAAAACTACTCAGATTTTTCTTTCCAGCCTCAAGTAGGGACAGCTGCATCATCAATCTCTCAATCTCAAACTAACC ATGTCCCTCTGGGGCAGCAAGCATGGAATTGTCAAGAGCCCACAAAACAGAATGATCAAAATGCTAATGGAAGATC CGAATTCAACACTGTACAGAATTTTATGCAGAATAATAATGATCAGAACAATAGTGGAAACCAATACAATCAGAGT ATAAGGGAGCAGAAAAGGTCAGATGACGGATACAATTGGAGGAAATACGGGCAGAAACAAGTAAAAGGTAGTGAAA ATCCGAGAAGCTACTACAAGTGTACATACCCAAATTGTCCCACCAAGAAGAAGGTTGAGAGATCTTTAGATGGTCA AATTACTGAAATTGTGTACAAGGGTAATCACAACCATCCAAAGCCTCAGTCTACCAGAAGATCGTCATCATCCACA GCTTCATCTGCATTCCAATCTTACAATACACAAACTAATGAAATTCCAGATCATCAATCCTATGGTTCAAATGGAC AAATGGATTCCGTTGCAACACCTGAGAATTCTTCGATTTCATTTGGGGATGATGATCATGAACACACTTCTCAAAA GAGTAGTAGGTCAAGAGGAGATGATCTTGATGAAGAGGAACCAGACTCAAAAAGATGGAAAAGAGAAAACGAAAGT GAAGGTGTATCTGCACTAGGAGGGAGTAGGACAGTTAGAGAACCTAGAGTTGTAGTTCAAACTACGAGTGACATCG ATATCCTAGATGATGGTTATAGATGGAGGAAGTATGGTCAAAAAGTAGTGAAAGGAAATCCTAATCCCAGGAGCTA CTACAAATGCACAAGTACGGGATGTCCAGTAAGAAAACATGTGGAAAGGGCATCACAAGACATAAGGTCAGTGATA ACAACCTATGAAGGGAAGCACAACCATGATGTTCCAGCAGCAAGGGGCAGTGGCAACCACTCAATTAACCGACCTA TGGCACCGACCATAAGGCCTACTGTGACATCTCATCAATCCAACTATCAAGTTCCATTACAAAGTATAAGGCCACA ACAGTCTGAAATGGGAGCACCCTTTACACTAGAGATGTTGCAGAAGCCTAATAATTATGGTTTCTCAGGATATGCA AATTCAGGGGATTCATATGAAAACCAAGTTCAGGACAATAATGTGTTTTCGAGAACTAAGGACGAGCCTCGAGATG ACTTGTTTATGGAGTCATTGCTTTGCTGAAACTGGAATCCTAGAAAGGAGCACGAATTGAAGTTTATGAAACGAAA AACTGAACCTTTTATTTATTTATTTTTGCATAAAGAATATGATAGGAAGCATTTTGATTTCATTTGTTAATAGATC ATATACTGTTTTTTTTTTTGGTGTGTGTACATTTTGTACTAGGAAATTTGTTTGTTGTAAATTCAATCAAATGCGG TGTAGATGTTCATGCAGTTACCACTGTTATGGGGGTTATATAATTTAGGATAGGAATGTAAATCCCCAACTCATGA CTATATGACACTGATTCTTTATTTCTATCACATTTTCAAGTTTTATATATTAAAGAAGATTGCAGTTTTTCAA Protein sequence>gi|460392301|ref|XP_004241755.1| PREDICTED: probable WRKY transcription factor 26 [Solanum lycopersicum] MAASSFSFPTSSSSFMTTSFTDLLASDDYPTKGLADRIAERTGSGVPKFKSLPPPSLPLSPPPFSPSSYFAIPPGL SPTELLDSPVLLSSSNLLPSPTTGSFPSRAFNWKSSSHQDVKQEDKNYSDFSFQPQVGTAASSISQSQTNHVPLGQ QAWNCQEPTKQNDQNANGRSEFNTVQNFMQNNNDQNNSGNQYNQSIREQKRSDDGYNWRKYGQKQVKGSENPRSYY KCTYPNCPTKKKVERSLDGQITEIVYKGNHNHPKPQSTRRSSSSTASSAFQSYNTQTNEIPDHQSYGSNGQMDSVA TPENSSISFGDDDHEHTSQKSSRSRGDDLDEEEPDSKRWKRENESEGVSALGGSRTVREPRVVVQTTSDIDILDDG YRWRKYGQKVVKGNPNPRSYYKCTSTGCPVRKHVERASQDIRSVITTYEGKHNHDVPAARGSGNHSINRPMAPTIR PTVTSHQSNYQVPLQSIRPQQSEMGAPFTLEMLQKPNNYGFSGYANSGDSYENQVQDNNVFSRTKDEPRDDLFMES LLC二.开放阅读框(ORF)的查找开放阅读框(Open Reading Frame, ORF)是基因序列中的一段无终止序列打断的碱基序列,可编码相应的蛋白。

在没有其它信息的前提下,DNA序列可能按六种框架阅读和翻译(每条链三种,对应三种不同的起始位点)。

ORF识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。

ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。

使用ORFfinder查找番茄WRKY26基因开放阅读框,这里使用默认参数,结果如图2.1所示。

图2.1WRKY26的ORF预测结果结果表明:如图2.1显示了ORF Finder 预测结果,给出了6个阅读框中可能的ORF图示、编码相位、位置及长度,这是根据六种不同的编码方式得到的(包括正反链)。

从预测结果可以看出,一个DNA序列可能有多个ORF。

相对而言,一段连续较长的ORF比较短的ORF更可能是编码序列。

图中第三条(紫色标注)为该基因的开放阅读框,其从18号碱基到1625号碱基,长度为1608bp。

相关主题