MCB课程真核细胞的基因表达和调控一,生物体内遗传物质的基本结构和功能单位是基因上个世纪70年代在细胞生物学,细胞遗传学和生物化学的基础上,经过一系列重大发现而奠定基础,逐步发展形成了分子生物学(molecular biology)这一现代生命学科。
分子生物学认为生物体内存在着决定生物体性状的遗传物质,其基本的结构和功能单位是基因(gene)。
基因的本质是一段携带着能合成功能蛋白质所需的全部信息的DNA,其中包括着蛋白质的编码序列,也包括非编码的调控序列。
基因主要具有两大功能。
一是指导合成蛋白质,通过蛋白质发挥的功能将遗传信息转换成具体的细胞性状和功能;二是通过细胞有丝分裂过程中的DNA复制(replication),将遗传信息传递给子代细胞,从而保持子代细胞与母代细胞性状的一致性。
基因在双螺旋结构的DNA长链组成的染色体上呈线性排列。
在哺乳动物的真核细胞中线性排列的基因以核小体 (nucleosome) 的形式被紧密包绕存在于细胞核中,组成核染质(chromatin)。
核小体的核心是由H2a,H2b,H3和H4四组组蛋白形成的八聚体,核心外包绕着1又3/4圈的DNA长链。
因此在电镜下核染质呈“串珠样“结构。
由于基因的本质是呈双螺旋结构的方向相反的两条脱氧核糖核酸(DNA)分子,因此基因的排列具有方向性,其DNA分子的5’端为基因的上游,3’端为基因的下游。
构成基因DNA分子序列的有腺嘌呤(A)胸腺嘧啶(T)胞嘧啶(C)和鸟嘌呤(G)4种碱基。
在双链DNA分子中一条DNA分子上的A总是以两条氢键与另一条DNA分子上的T相结合,而C总是以三条氢键与G相结合。
A与T,C与G之间称为互补关系(complementary)。
双链DNA分子中A,T,C,G的不同组合排列形成了三联密码,每一个三联密码都代表着一种相应的氨基酸。
然而,基因中的编码序列往往并不连续,其中间隔着非编码的序列。
这些编码的序列称为基因结构中的外显子,而非编码序列称为内含子。
在基因的上游端具有启动基因表达作用的特殊序列称为启动子,它们的序列中富含A,T,C, 在基因的上游,下游较远处,乃至基因内部还有某些序列对基因的表达有明显的促进作用,称为增强子。
基因的下游端往往还有基因表达的终止信号。
上述基因本身的主要结构统称为基因的顺式元件,而参与基因表达过程的基因外的蛋白质因子称为基因的反式元件(见下节)。
上述排列着基因的DNA成为基因组DNA,真核细胞中除了基因组DNA携带遗传信息外,线粒体中能独立复制的DNA也携带着遗传信息。
( 图1: 分子生物学的中心法则------基因的表达 )二,生物个体的基因型决定了表现型—分子生物学的中心法则生物体内基因所携带的遗传信息是通过分子生物学中心法则(central dogma)所表述的过程转变成生物体的性状的。
中心法则表明,一方面基因作为DNA可以通过复制使遗传信息传递给新生的DNA分子,从而传给子代细胞。
另一方面,携带遗传信息的DNA分子可以作为模版,通过转录(transcription)而传递给转录产物RNA(核糖核酸)分子, RNA又能通过翻译(translation)将其携带的遗传信息再转换成多肽/蛋白质,从而使基因所携带的遗传信息最终转换成功能蛋白质而赋予生物体细胞特定的性状。
基因的遗传信息从DNA 的形式最终转换成功能蛋白质的整个过程称为基因的表达。
生物体内基因的结构和功能形式称为基因型(genotype),而生物体表现的外部形状称为表现型(phenotype)。
所以,理论上生物体有怎样的基因就会产生怎样的性状。
生物体的基因型决定了表现型。
但在实际的具体生物个体上,基因型与表现型的关系不一定很明确。
特别是在真核细胞生物中,一方面其细胞中含有比原核细胞复杂得多的遗传物质,其基因的数目成千上万,基因结构更精细更复杂。
而这些遗传物质以一定的方式被紧紧包裹压缩在细胞核内的极小的空间里。
另一方面,真核细胞生物大多数为多细胞生物,生物体内往往已进化出多种组织细胞,它们具有完全相同的基因型,却在生物体生长发育的不同阶段表现出不同的表型和功能。
所以,作为多细胞组成总体的真核细胞生物来说,许多基因的功能不一定能在外部明确表现出来,许多基因的功能之间可以重叠和互补,因而掩盖了某一单个基因的功能。
同时,具有某一种功能的基因都是以等位基因的形式成对地分别排列在一对染色体的相应位点上的。
如果等位基因中的一个基因发生缺损,另一基因仍正常发挥功能,生物体的性状并不发生改变,必须两个基因都失去功能,生物体的性状才会发生改变。
这样的基因称为隐性基因。
如果等位基因中的一个基因发生缺损生物体的性状即发生改变。
这样的基因称为显性基因。
此外在形成生殖细胞的减数分裂过程中,线性排列在一对染色体上的几个基因有可能由于一段染色体的同源交叉(crossover)而变换位置,发生重组。
如果不同基因之间距离很近,往往同时变换位置,因而重组体的子代细胞中,它们决定的几种性状也往往同时出现或改变。
这些基因之间称为具有连锁关系(linkage). 位于性染色体X上的基因为性连锁基因,它们所决定的性状与一定的性别同时出现,称为伴性遗传。
总之,真核细胞生物的基因型和表现型之间的相互关系日趋复杂和精细,而两者之间的关系,即细胞的基因型如何转换成表现型,就取决于基因如何表达的过程和被调控的机理。
Staudt LM. N Engl J Med. 2003;348:1777-1785三,真核细胞内基因的表达过程和调控机理真核细胞内的基因表达是一个多步骤的,连续的,精细复杂的过程。
主要可分为转录,转录后加工,翻译和翻译后修饰三个大阶段。
转录是基因表达的第一步,是在细胞核内由单链的基因组DNA为模版,以RNA聚合酶和一系列酶为工具进行的合成反应,其产物是单链的RNA分子。
转录从基因上游5’端的启动子开始,RNA聚合酶II为主的转录复合物(主要是通用转录因子GTFs与其他因子构成的全酶 holoenzyme).结合到启动子上后不断沿着DNA模版向基因的3’端移动,转录也即开始从基因的5’端向3’端进行。
直到RNA 聚合酶II为主的转录复合物达到模版上基因的终止信号后,转录复合物即与模版分离,使转录停止。
转录过程中RNA聚合酶II根据与DNA模版序列的互补原则,将带有四种碱基的核苷酸聚合成RNA分子,不过RNA中不存在T,由与A互补的U代替。
为了使RNA聚合酶和其他蛋白质因子易于结合到基因的启动子上,首先必须使基因所在的核染质的空间构型松解开放,双链DNA必须解聚为单链,这些都需要一系列酶的参与,如拓扑酶,解旋酶等,也涉及核染质构型的重塑机制 (chromatin remodeling). 这一过程主要是由构成核小体中的组蛋白在核内酶的作用下发生周期性的乙酰化和去乙酰化,从而使核染质的构型不断发生紧缩闭合和松解开放的交替变化。
当核染质松解开放时,外来的转录因子等蛋白质容易接近而与DNA上基因的转录启始点结合而启动基因的转录;反之,当核染质变得紧缩闭合时,外来的转录因子等蛋白质难以接近DNA上基因的转录启始点,AcetylationDeacetylation(图2: 核小体组成的核染质的重塑)新生的转录产物RNA称为核内不均一RNA,很不稳定,容易降解。
必须经过RNA的转录后加工(post-transcriptional processing)才能成为稳定的mRNA. 大约只有15-20%的核内不均一RNA被加工成mRNA.,通过细胞核核膜上的核孔输出到细胞质中,到核糖体上进一步翻译。
RNA的转录后加工主要包括在5’端加上M-7Gppp 帽,在3’端加上约20个多聚腺苷酸 (poly A)的尾,以及RNA分子的剪切(splicing). 剪切是复杂精细的过程,由核内剪切子(spliceosome)或称snRNPs介导进行,它可识别RNA中内含子5’端和3’端的GU和AG,将前后两个外显子的两端拉近,中间内含子部分形成的攀被RNA酶切除后,各外显子就连接成完整的mRNA.。
由于剪切过程中可以发生不同的剪切方式,即选择性剪切(alternative splicing), 形成的mRNA.中可能含有同一基因的多段不同的外显子成分,因而可翻译成几种结构和功能不完全相同的蛋白质异构体。
使单一的基因可以编码几种蛋白质。
mRNA在细胞质内翻译的场所是核糖体(ribosome),它由60S 和40S的两个亚单位组成,其中分别含有28S 和18S两种核糖体RNA(rRNA)。
mRNA分子遭遇附着核糖体后,其戴帽的5’端就从两个亚单位之间穿过并前行。
也即核糖体沿着作为模版的mRNA从5’端向3’端移动。
随着移动核糖体就能读出mRNA分子序列中的三联密码,每种三联密码都编码一种氨基酸,但每种氨基酸可以有几种相应的三联密码,其中AUG不编码氨基酸,而代表翻译的起始密码,UAA,UGA和 UAG代表翻译终止的密码。
基因的翻译还需要转运RNA (tRNA)的参加。
tRNA分子呈三叶草状,一条臂可与rRNA相连合,一条臂携带一个氨基酸,另一条臂为反密码臂。
当核糖体读到某三联密码时,具有与此密码互补的反密码臂的tRNA就会结合到核糖体上,从而将相应的氨基酸带来并整合到氨基酸链上。
随着氨基酸的增加,合成的肽链不断延长。
直到核糖体读到终止密码,mRNA分子与核糖体分离,翻译即告终止。
从AUG开始,三联密码必须遵循一定的开放阅读框架 (open reading frame ORF) 阅读,直到终止密码,才能合成正确的氨基酸肽链,如果ORF改变,合成的氨基酸肽链也就变了。
例如当mRNA模版发生突变或缺失时ORF发生改变。
此时,合成的肽链中某些氨基酸可能发生改变,使其功能受到一定影响,这种突变成为误义突变。
也可能所发生突变或缺失使终止密码提早出现,从而使肽链不能合成或仅仅能合成很短,并导致丧失功能,这种突变成为无义突变。
一条mRNA模版可以同时穿过多个核糖体,也即多个核糖体可同时按序从mRNA分子的5’端向3’端移动,所以一条mRNA模版可以同时翻译合成多条肽链。
翻译合成的肽链尚不是最终产物功能蛋白质,还必须经过翻译后加工,包括肽链间的连接裁剪,形成蛋白质后分子的折叠,以及糖基化,磷酸化,乙酰化等修饰,才能最后成为具有功能的蛋白质。
(图3: 真核细胞基因转录调控的模式图)处于某一时刻的真核细胞内并非所有的基因都在同时有同样水平的表达。
对于一个细胞体内每时每刻都在进行的如此精细复杂的多步骤的连续过程,显然需要有一套精密灵敏的调控机制加以掌握,才能保证所有基因在质,量和时空各方面的准确高效表达,以敷细胞各种生理功能行为之需。
如果表达调控机制出了差错,必然使细胞遭受危害,甚至是致命的打击。