生物大分子 (biomacromolecule):具有较大的分子量,由简单的小分子排列组成,具有复杂的空间结构形成精确的相互作用系统,构成生物的多样化和生物个体精确的生长发育和代谢调节控制系统.阐明生物大分子复杂的结构及结构与功能的关系是分子生物学的主要任务.基因芯片技术:将大量探针分子(通常每平方厘米点阵密度高于 400 )固定于支持物上后与标记的样品分子进行杂交,通过检测每个探针分子杂交信号的强度,获取样品分子的数量和序列信息.基因:是DNA分子中含有特定遗传信息的一段核苷酸序列,是遗传物质的最小功能单位,对于编码蛋白质的结构基因来说,基因是决定一条多肽链的DNA片段。
根据其是否具有转录和翻译功能可以把基因分为三类:第一类是编码蛋白质的基因,它具有转录和翻译功能,包括编码酶和结构蛋白的结构基因以及编码阻遏蛋白的调节基因.第二类是只有转录功能而没有翻译功能的基因,包括tRNA基因和rRNA基因.第三类是不转录的基因,它对基因表达起调节控制作用,包括启动基因和操纵基因.基因组:(genome):泛指一个有生命体、病毒或细胞器的全部遗传物质;在真核生物,基因组是指一套染色体(单倍体)DNA。
携带生物体全部遗传信息的核酸量。
基因组中不同的区域具有不同的功能:有些区域编码蛋白质的结构基因有些区域复制及转录的调控信号有些区域的功能尚不清楚真核生物基因组特点:1. 真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组.2. 真核细胞基因转录产物为单顺反子。
一个结构基因经过转录生成一个mRNA分子,再翻译生成一条多肽链.3. 存在重复序列,重复次数可达百万次以上4. 基因组中不编码的区域多于编码的区域5. 大部分基因含有内含子,因此,基因是不连续的(断裂基因,split gene)6. 基因组远远大于原核生物的基因组,具有许多复制起始点,而每个复制子的长度较小.高度重复序列(high repeated sequence)高度重复序列在基因组中重复频率高,可达百万(106)以上,因此复性速度很快在基因组中所占比例随种属而异,约占10-60%,在人基因组中约占 20 %。
高度重复顺序又按其结构特点分为三种:反向重复序列、卫星DNA、较复杂的重复单位组成的重复顺序(灵长类动物独有)。
卫星DNA(satellite DNA):由2-10bp组成重复单位,重复单位成串排列而成,由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA 分开,因而称为卫星DNA (或随体DNA),人的卫星DNA可分为Ⅰ、Ⅱ、Ⅲ、Ⅳ四种。
microsatellite marker又称short tandem repeat,(STR),最重要的优点是高度多态性,提供的信息量相对很大;另外可用PCR技术使操作实现自动化。
STR的遗传学图距是以cM (厘摩尔根)为单位的,反映基因遗传效应的基因组图。
中度重复序列(middle repeated sequence):Alu家族、KpnⅠ家族、Hinf家族、rRNA基因、多聚dT-dG家族、组蛋白基因。
多基因家族(multigene family):是指由某一祖先基因经过重复和变异所产生的一组基因。
大致可分为两类:一类是基因家族成簇地分布在某一条染色体上,其可同时发挥作用,合成某些蛋白质(如:组蛋白基因家族就成簇地集中在第 7 号染色体长臂 3 区 2 带到 3 区 6 带区域内)。
另一类是一个基因家族的不同成员成簇地分布不同染色体上,这些不同成员编码一组功能上紧密相关的蛋白质(如珠蛋白基因家族)假基因(pseudo gene):在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因,假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺失,倒位或点突变等,使这一基因失去活性,成为无功能基因。
超基因(Super gene):人体基因组中还有几个大的基因簇,也属于中度重复序列的长分散片段。
在一个基因簇内含有几百个功能相关的基因,这些基因簇又称为超基因,如人类主要组织相容性抗原复合体HLA和免疫球蛋白重链及轻链基因都属于超基因。
可能是由于基因扩增后又经过功能和结构上的轻微改变而产生的,但仍保留了原始基因的结构及功能的完整性。
真核生物的结构基因不仅在两侧有非编码区,而且在基因内部也有许多不编码蛋白质的间隔序列(intervening sequences),称为内含子(intron),编码区则称为外显子(exon),内含子与外显子相间排列,转录时一起被转录下来,然后内含子被切掉,外显子连接在一起成为成熟的mRNA作为指导蛋白质合成的模板。
基因表达(gene expression):DNA分子将其所承载的遗传信息,通过转录生成mRNA,再指导合成蛋白质的过程。
可诱导调节:是指一些基因在特殊的代谢物或化合物的作用下,由原来关闭的状态转变为工作状态,即在某些物质的诱导下使基因活化。
如乳糖操纵子。
可阻遏调节:这类基因平时都是开启的,处在生产蛋白质或酶的工作过程中,由于一些特殊代谢物或化合物的积累而将其关闭,阻遏了基因的表达。
如色氨酸操纵子。
原核基因调控机制的类型与特点:正转录调控(positive):调节基因的产物是激活蛋白(activator)–正控诱导:效应物使激活蛋白处于活性状态。
–正控阻遏:效应物使激活蛋白处于非活性状态负转录调控(negative):调节基因的产物是阻遏蛋白(repressor)。
–负控诱导:阻遏蛋白与效应物结合,结构基因转录。
–负控阻遏:阻遏蛋白与效应物结合,结构基因不转录。
转录正调控: 指调节产物(活化蛋白)结合结构基因上游的顺式作用元件,激活RNA 聚合酶对转录的起始。
转录负调控: 指调节产物(阻遏蛋白)结合操纵基因,阻遏RNA聚合酶对转录的起始。
葡萄糖效应(降解物抑制作用):大肠杆菌生长在既有葡萄糖又有其他糖类(乳糖等)的介质中,只能利用葡萄糖,当葡萄糖耗尽后才能利用其他糖类,即葡萄糖阻断多种操纵子(葡萄糖敏感操纵子)的表达。
葡萄糖效应机理:葡萄糖代谢降解物降低细胞内c AMP的浓度,不能与环腺苷酸受体蛋白CRP 或称代谢降解物激活蛋白(CAP)形成足够的c AMP-CAP活性复合物以促使RNA聚合酶与启动子的结合,葡萄糖敏感操纵子不能表达.乳糖操纵子包括:•启动子(promotor, P);•操纵基因(operator, O);•结构基因(Z、Y、A):分别编码β-半乳糖苷酶、β-半乳糖苷透过酶、β-半乳糖苷乙酰基转移酶乳糖操纵子调控模型的主要内容:①ZYA基因的产物由同一条多顺反子的mRNA分子所编码;②该mRNA分子的启动子(P)位于阻遏基因(I)与操纵基因(O)之间,不能单独起始半乳糖苷酶和透过酶基因的高效表达;③操纵基因是DNA上的一小段序列(仅为26bp),是阻遏物的结合位点;④当阻遏物与操纵基因相结合时,lac mRNA的转录起始受到抑制;⑤诱导物通过与阻遏物结合,改变它的三维构象,使之不能与操纵基因相结合,从而激发lac mRNA的合成。
trp操纵子的阻遏系统trpR基因产物称为辅阻遏蛋白(aporepressor),与色氨酸相结合形成有活性的阻遏物,与操纵基因结合并关闭trp mRNA转录。
效应物是色氨酸,是由trp操纵子所编码的生物合成途径的末端终产物。
当培养基色氨酸含量高,它与辅阻遏蛋白结合,与操纵基因结合,阻遏 mRNA 的转录;当色氨酸不足时,辅阻遏蛋白失去色氨酸并从操纵基因上解离,trp操纵子去阻遏,mRNA开始转录。
trp操纵子的弱化系统:1、弱化子:位于trpE基因的起始密码前162bp的前导区中的123-150位碱基序列。
该区的mRNA可形成茎-环结构,有终止的作用。
2、前导肽:在色氨酸操纵子的前导序列中可能存在前导肽,14个氨基酸。
在第10和11位上有相邻的两个色氨酸密码子。
前导区的序列分析:具有4个分别以1、2、3、4表示的片段,能以两种不同的方式进行碱基配对:1-2、3-4,或2-3配对。
3-4 配对区正好位于终止密码子的识别区域。
形成发夹结构能力强弱:序列1/2>序列2/3>序列3/43、转录弱化作用:mRNA转录的终止是通过前导肽基因的翻译来调节的。
前导肽基因中有两个相邻的色氨酸密码子,这个前导肽的翻译必定对tRNATrp的浓度敏感。
弱化子对RNA聚合酶的影响依赖于前导肽翻译中核糖体的位置4、细菌通过弱化作用弥补阻遏作用的不足,因为阻遏作用只能使转录不起始,对于已经起始的转录,只能通过弱化作用使之中途停顿下来。
二组分调控系统(two-component systems):由位于细胞质膜上的传感蛋白(sensor protein)和位于细胞质内的应答调节蛋白(response regulator protein)组成。
半乳糖操纵子(galactose operon):诱导物是半乳糖。
特点:1.调节基因gelR与结构基因和操纵区距离很远;2.两个启动子;3.有两个O区。
葡萄糖升高,cAMP-CRP下降;葡萄糖下降,cAMP-CRP升高。
S1的转录:无葡萄糖,有半乳糖,高浓度的CRP和cAMP。
抑制S2的转录。
S2的转录:有葡萄糖。
一般认为:cAMP-CRP有利于RNA聚合酶- S1区复合物的形成开链构想,从而起始基因转录。
同时,由于S1和S2区的核苷酸部分重叠,这一复合物的存在干扰了RNA聚合酶- S2复合物的形成,抑制了S2起始的基因转录。
阿拉伯糖操纵子•3个结构基因:araB、araA、araD•一个复合的启动子区、两个操纵区和一个调节基因araC。
•AraC蛋白同时具有正、负调节因子的功能。
•阿拉伯糖是诱导物。
AraC蛋白的正、负调节作用•AraC蛋白本身是负调节蛋白-阻遏蛋白(Pr);•有阿拉伯糖、cAMP-CRP同时存在, AraC蛋白成为正调节蛋白-激活蛋白(Pi)AraC蛋白的两种异构体: Pr与Pi细菌中的SOS应答与阻遏蛋白LexA•SOS是细菌DNA受到破坏时,启动的诱导型DNA修复系统。
•LexA是SOS应答体系的阻遏蛋白。
•recA基因表达1000个RecA蛋白。
•DNA严重受损时, RecA蛋白与单链DNA缺口结合,被激活为蛋白酶,切割LexA蛋白使之失活。
多启动子调控的操纵子•rRNA操纵子(rrnE):两个启动子P1和P2,P1是强启动子,快速生长时;P2营养缺乏时,弱启动子。
•核糖体蛋白SI操纵子(rpsA):四个启动子,P1P2强启动子;P3P4弱启动子。
•DnaQ蛋白操纵子:DNA聚合酶亚基,校正DNA复制;受RNA聚合酶活性调节;魔斑(magic spot):鸟苷四磷酸(ppGpp)和鸟苷五磷酸(pppGpp),可在层析谱上检出。