综 述R evie w2002201215收到,2002201228接受。
国家重点基础研究发展规划项目(973项目G 1999011604)资助。
3联系人,E 2mail :zywang @ ,Tel :02126404209024423。
植物MYB 类转录因子研究进展陈 俊 王宗阳3(中国科学院上海植物生理研究所,上海200032)摘要:植物M Y B 转录因子以含有保守的M Y B 结构域为共同特征,广泛参与植物发育和代谢的调节。
含单一M Y B 结构域的M Y B 转录因子在维持染色体结构和转录调节上发挥着重要作用,是M Y B 转录因子家族中较为特殊的一类。
含两个M Y B 结构域的M Y B 转录因子成员众多,在植物体内主要参与次生代谢的调节和控制细胞的形态发生。
含3个M Y B 结构域的M Y B 蛋白与c 2M Y B 蛋白高度同源,可能在调节细胞周期中起作用。
关键词:M Y B 结构域,M Y B 转录因子,组合调控学科分类号:Q74 随着多种模式生物基因组计划的完成,如何从这些浩如烟海的DNA 序列中揭示基因的功能以及它们有序的时空表达,已成为后基因组时代的重要课题。
人类基因组计划的完成显示人类只有30000~50000个基因,生命体是如何以如此少的基因完成如此复杂的生命活动的呢?很重要的一点在于基因的表达调控,使得每一个基因能适时、适地、适量地表达,并且使得某些基因可以产生多种功能各异的蛋白质。
真核基因的表达随细胞内外环境的改变而在不同层次上受到精确调控,如染色体DNA 水平、转录水平及转录后水平的调控等。
而转录水平的调控发生在基因表达的初期阶段,是很多基因表达调控的主要方式。
转录水平的调控指一类称为转录因子(有时又称反式作用因子)的蛋白质特异结合到靶基因调控区的顺式作用元件上,或调节基因表达的强度,或应答激素刺激和外界环境胁迫,或控制靶基因的时空特异性表达。
转录因子通常是一种模块化的蛋白,一般由几个独立的功能域组成,包括DNA 结合功能域,转录激活功能域,蛋白2蛋白相互作用功能域,信号分子结合功能域,核定位信号区等。
根据DNA 结合功能域的结构,转录因子可分为以下几类:bHL H (碱性螺旋2环2螺旋)、bZIP (碱性亮氨酸拉链)、homeodomain 蛋白、MADS 2box 蛋白、zinc 2finger 蛋白、Myb 蛋白、Ap2/EREBP 蛋白、HSF 蛋白、HM G蛋白和A T hook 蛋白等(Schwechheimer 和Bevan 1998)。
本文试以植物中数量最多、功能最多样化的M Y B 类转录因子为例,对该类转录因子的研究历史和现状作一简单介绍。
阐述了M Y B 转录因子的结构、功能和进化,并举例说明M Y B 类转录因子如何与其它转录因子家族成员相互作用,通过组合调控(combinatorial control )的方式实现对靶基因的精密调控。
1 MYB 类转录因子M Y B 类转录因子家族是指含有M Y B 结构域的一类转录因子。
M Y B 结构域是一段约51~52个氨基酸的肽段,包含一系列高度保守的氨基酸残基和间隔序列(图1)。
首先是每隔约18个氨基酸规则间隔的色氨酸(W )残基,它们参与空间结构中疏水核心的形成。
有时色氨酸残基会被某个芳香族氨基酸或疏水氨基酸所取代,尤其是在植物R2R32M Y B 转录因子中,R3M Y B 结构域的第一个色氨酸经常被亮氨酸、异亮氨酸或苯丙氨酸所取代。
其次,在每个保守的色氨酸前后都存在一些高度保守的氨基酸,例如在第一个色氨酸的C 2末端通常是一簇酸性氨基酸(图1)。
正是上述这些保守的氨基酸残基使M Y B 结构域折叠成螺旋2螺旋2转角2螺旋(helix 2helix 2turn 2helix )结构。
1982年K lempnauer 等在禽成髓细胞瘤病毒(avian myeloblastosis virus )中鉴定出一个能直接导致急性成髓细胞白血病(acute myeloblastic leukemia )的癌基因,称为v 2myb ,不久发现在正常动物细胞中也存在相应的原癌基因c 2myb ,随后研究结果表明v 2M Y B ,c 2M Y B 蛋白都定位在细胞核中,与核基质和染色质紧密相连,而且都具有DNA18植物生理与分子生物学学报,J ournal of Plant Physiology and Molecular Biology 2002,28(2):81-88结合活性和转录调节功能(Biedenkapp等1988, Luscher和Eisenman1990)。
Ogata等(1994)通过核磁共振(NMR)的方法最终确定了c2M Y B蛋白结合DNA时的空间结构,明确表明c2M Y B蛋白的3个M Y B结构域都能形成类似于螺旋2转角2螺旋的结构,其中R2和R3负责特异结合DNA序列。
至此,尽管M Y B蛋白不具备当时已知的转录因子类型,如bHL H、bZIP和zinc finger等的结构花式(motif),然而对c2M Y B蛋白和v2M Y B蛋白的研究结果都显示,M Y B类蛋白都含有由M Y B结构域组成的DNA结合功能域为共同特征,它们自成一类新的转录因子家族。
图1 M Y B转录因子的DNA结合功能域Fig.1 DNA2binding domain of M Y B transcription factorsDNA binding domains of M Y B transcription factors are aligned by Pileup program from GCG software package.The protein se2 quences included in this comparison are from human,c2M Y B;A rabidopsis,Atpc2myb1,Atpcmyb2,At G L1;maize,IBP1,Zm2 M Y BC1;Oryz a sativa,RTBP1.Among them,IBP1and RTBP1contain only a single M Y B domain;At G L1and ZmM Y BC1 are R2R32M Y B proteins;Atpc2myb1,Atpcmyb2and c2M Y B belong to R1R2R32M Y B subfamily.The regularly spaced W residues and I,F residues often re placing the W residue in R3M Y B domain are in bold.The C ys residue involved in redox poten2 tial regulation is italic and in bold.The DNA recognition helix of IBP1,RTBP1are boxed. 1982年以来,人们不断地从人、小鼠、酵母、玉米、拟南芥、金鱼草、水稻和棉花中鉴定出与c2M Y B蛋白同源的蛋白。
它们的共同特征是N2端区域高度保守,通常由2个M Y B结构域(R2,R3)或3个M Y B结构域(R1,R2和R3)构成。
植物物种中的M Y B蛋白与c2M Y B蛋白不同,大都只含有两个M Y B结构域,这极大地引起了人们对植物中M Y B类转录因子的研究兴趣。
自从Paz2Ares等从单子叶植物玉米中克隆出与色素合成有关的Zm M YB C1基因后,又从很多植物中分离到功能各异的m yb基因(Rabinowicz等1999)。
Romero等(1998)的研究指出拟南芥中至少有80个表达的m yb基因。
Rabinowicz等(1999)发现玉米中至少也含有80个表达的m yb基因。
除含两个M Y B结构域的M Y B蛋白以外,在植物中还发现了含一个M Y B结构域的M Y B蛋白以及含3个M Y B结构域的M Y B蛋白。
Stmyb1是植物中鉴定的第一个只含一个M Y B结构域的M Y B蛋白,随后相继发现IBP1、BPF1、CCA1和L H Y等只含有一个M Y B结构域的M Y B蛋白(Bilaud等1996)。
植物中含3个M Y B结构域的M Y B蛋白的发现,更是极大地丰富了人们对植物M Y B蛋白的认识(Kranz等2000)。
植物中含单个M Y B结构域和含3个M Y B结构域的M Y B蛋白与主要的含两个M Y B结构域的M Y B蛋白共同构成了植物M Y B类转录因子家族,并与动物等其它物种中的M Y B蛋白形成了一类古老而且高度保守的转录因子超家族。
2 植物MYB类转录因子家族植物M Y B类转录因子以含有M Y B结构域为共同特征,根据所含M Y B结构域的数目,植物中的M Y B类转录因子可简单分成3个亚类:只含一28植物生理与分子生物学学报 28卷个M Y B 结构的M Y B 蛋白亚类成员可能是一类重要的端粒结合蛋白,在维持染色体结构的完整性和调节基因转录上起重要作用(Bilaud 等1996);R2R3亚类成员含有两个M Y B 结构域,对应于动物中c 2M Y B 蛋白的R2和R3M Y B 结构域。
该类成员数目众多,它们或参与次生代谢的调节,或控制细胞的分化,或应答激素刺激和外界环境胁迫以及抵抗病原菌的侵害;R1R2R3亚类成员含有3个M Y B 结构域,与动物、真菌中的R1R2R32M Y B 蛋白高度同源,主要参与细胞周期的控制和调节细胞的分化(Ito 2000)。
表1列举了已知的植物M Y B 类转录因子及其可能的生物学功能。
2.1 植物中只含一个MYB 结构域的MYB 蛋白植物中发现的这类M Y B 蛋白,如表1所示,有L H Y 、CCA1、CPC 和R TBP1(Yu 等2000)等。
它们在结构上都只含一个M Y B 结构域,可存在于肽链的N 2端,C 2端或中间。
由于无论是R1R2R32M Y B 蛋白还是R2R32M Y B 蛋白,它们的R2、R3M Y B 结构域都是特异结合DNA 序列所必需,而只含一个M Y B 结构的M Y B 蛋白很可能以不同的方式结合DNA 序列,如水稻R TBP1蛋白正是通过形成同源二聚体而结合到端粒序列上(Yu 等2000)。
根据是否具有一种称为端粒盒(TELOBOX )的结构,可以把这类M Y B 蛋白分成两个小类。
第一小类成员都含有端粒盒结构,如IBP1、R TBP1、BPF1和PcM Y B1蛋白等(表1)。