第3章基因与基因组的结构1.主要内容1)断裂基因构成性质2)重叠基因种类3)C值矛盾4)原核生物与真核生物基因组的区别5)真核生物染色体的结构6)真核生物DNA序列的4种类型7)基因家族、基因簇、卫星DNA、分散重复DNA 序列8)人类基因组计划2.教学要求1)掌握基因,断裂基因,顺反子,C值矛盾,重叠基因,基因家族,重复序列,卫星DNA等基本概念;2)熟悉原核生物和真核生物基因组结构特点与功能;3)了解人类基因组的重复顺序、人类基因组计划。
第1节基因的概念第2节基因命名简介第3节真核生物的断裂基因第4节基因及基因组的大小与C值矛盾第5节重叠基因第6节基因组第7节真核生物DNA序列组织第8节基因家族第9节人类基因组研究进展第1节基因的概念●基因:带有特定遗传信息的核酸分子片段。
包括结构基因:编码蛋白质tRNA rRNA调控基因:●基因研究的发展染色体分子反向生物学●基因位于染色体和细胞器的DNA分子上•基因和顺反子•1955,Benzer用以表述T4 具溶菌功能的区的2个亚区: rⅡA rⅡB•现代分子生物学文献中,顺反子和基因这两个术语互相通用。
第2节基因命名简介•表示基因3个小写斜体字母,lac•表示基因座3个小写斜体字母+ 1个大写斜体字母。
lacZ•表示质粒自然质粒 3 个正体字母,首字母大写重组质粒在2个大写字母前面加小写p•基因为斜体,蛋白质为正体•人类基因为大写斜体第3节真核生物的断裂基因•一、割裂基因的发现•1977,通过成熟mRNA(或cDNA)与编码基因的DNA杂交试验而发现•真核生物的基因是不连续的,大大改变了原来对基因结构的看法,现在知道大多数真核生物的基因都是不连续基因或割裂基因(split gene)。
•割裂基因的概念——是编码序列在DNA分子上不连续排列而被不编码的序列所隔开的基因。
•割裂基因的构成•构成割裂基因的DNA序列被分为两类:•基因中编码的序列称为外显子(exon),外显子是基因中对应于信使RNA序列的区域;•不编码的间隔序列称为内含子(intron),内含子是从信使RNA中消失的区域。
•割裂基因由一系列交替存在的外显子和内含子构成,基因两端起始和结束于外显子,对应于其转录产物RNA的5’和3’端。
如果一个基因有n个内含子,则相应地含有n+1个外显子。
●割裂基因的性质•Splitting Gene 的普遍性•外显子和内含子各有特点•Splitting gene 概念的相对性●Splitting Gene 的普遍性a) 真核生物(Eukaryots)中•绝大部分结构基因•tDNA, rDNA•mtDNA, cpDNAb) 原核生物(Prokaryots)中•SV40 大T 抗原gene•小t 抗原gene•Splitting gene 并非真核生物所特有●外显子和内含子各有特点•割裂基因的外显子在基因中的排列顺序和它在成熟mRNA产物中的排列顺序是相同的;•某种割裂基因在所有组织中都具有相同的内含子成分;•核基因的内含子通常在所有的可读框中都含有无义密码子(nonsense codon),因此一般没有编码功能。
•内含子上发生的突变不能影响蛋白质的结构,所以其突变往往对生物体是没有影响的;•但也有例外,例如一些发生在内含子上的突变可通过抑制外显子的相互剪接阻止信使RNA的产生。
•利用结构基因的特殊DNA限制片段作为探针,我们可以检测基因组中与之有亲缘关系的序列,结果表明一个基因的外显子常与其他基因的外显子有亲缘关系。
•两个相关基因内含子之间的亲缘关系远远不如其外显子之间的亲缘关系紧密。
•这是因为在进化过程中,相关基因的内含子比外显子变化得更快。
●Splitting gene 概念的相对性a)Intron 并非“含而不露”Yeast 细胞色素b基因Intron II 编码成熟酶b)Exon 并非“表里如一”人类尿激酶原基因Exon I 不编码氨基酸序列c) 并非真核生物所有的结构基因均为splitting geneHistone gene family干扰素Yeast 中多数基因(ADH…)第4节基因及基因组的大小与C值矛盾•由于割裂基因的存在,人们认识到基因比实际编码蛋白质的序列要大得多。
•外显子的大小与基因的大小没有必然的联系。
•不同种类的生物体中外显子的大小并没有明显的不同,基因可能是由一些小的、编码较小的独立蛋白质分区的单位在进化过程中加合起来的。
●基因的大小取决于它所包含的内含子的长度•内含子之间有很大不同,它们的大小从200个碱基对左右到上万个碱基对。
在一些极端的例子里,甚至有50- 60 kb的内含子。
•由于基因的大小取决于内含子的长度和数目,导致酵母和高等真核生物的基因大小有很大的不同。
•大多数酵母基因小于2 kb,很少有超过5 kb的。
•与此相反,在高等的真核生物中,开始出现长的基因,蝇类和哺乳动物基因很少小于2 kb,大多数长度在5~100 kb之间。
•但当基因的长度大到一定程度后,DNA的复杂性与生物体的复杂性之间开始失去必然的联系。
•例如虽然属于同一个门,果蝇细胞的DNA总量较小而家蝇细胞的DNA总量却是它的6倍。
●基因组•狭义:单倍体细胞中的全套染色体(人:22条常染色体+ X,Y + 线粒体DNA)。
•广义:一物种的全部遗传物质及其携带的遗传信息。
●基因组大小与C值矛盾•一个单倍体基因组的全部DNA含量总是恒定的。
这是物种的一个特征,通常称为该物种的C值。
•不同物种的C值差异很大,最小的枝原体只有直106bp,而最大的如某些显花植物和两栖动物可达lO11bp。
Range of genome size in different phyla门植物动物真菌等细菌•由图表可见,随着生物的进化,生物体的结构和功能越来越复杂,其C值就越大,例如真菌和高等植物同属于真核生物,而后者的C值就大得多。
这一点是不难理解的,因为结构和功能越复杂,需要的基因产物的种类越多,也就是说需要的基因越多,因而C值越大。
•然而另一方面,随着进一步的进化,生物体复杂性和DNA 含量之间的关系变模糊了,出现了很多令人不解的现象。
一些生物类群基因组大小的变化范围很窄,而另一些类群的变化范围则很宽。
•突出的例子是两栖动物,C值小的可以低至109bp以下,C值大的可以高达1011bp。
而哺乳动物的C值均为109bp的数量级。
人们很难相信不同的两栖动物,所需基因的数量会有100倍的差别,而且两栖动物的结构和功能会比哺乳动物更复杂。
•由于人们无法用已知功能来解释基因组的DNA含量,所以产生了C值矛盾(C value paradox,又称C值悖理)。
•它表现在两个方面:一个方面是,与预期的编码蛋白质的基因的数量相比,基因组DNA的含量过多。
另一个方面是一些物种之间的复杂性变化范围并不大,但是C值却有很大的变化范围。
这些问题的解决有待于进一步的研究。
第5节重叠基因●莲人在绿杨津采一玉漱声歌新阙●采莲人在绿杨津,在绿杨津一阙新;一阙新歌声漱玉,歌声漱玉采莲人。
一、原核生物的重叠基因 (overlapping gene)•在细胞基因中,一般一段DNA序列只以三种蛋白质可读框的一种被阅读,但是在一些病毒或线粒体基因中,两个邻近的基因以一种巧妙的方式发生重叠,并以不同的可读框被阅读并表达,因此一段相同的DNA序列可以编码两个非同源蛋白质。
φXl74的DNA序列组织上有重叠基因(overlap-ping gene)和基因内基因重叠基因有以下几种情况:①一个基因完全在另一个基因内部如:B和A*E和D其读码结构互不相同重叠基因基因内基因部分重叠基因一个碱基重叠二、真核生物的重叠基因•通常割裂基因的每个外显子编码一段单一的氨基酸序列,对应于整个蛋白质上的相应部分,而内含子不在最终的蛋白质产物中表达,二者的作用是迥然不同的。
但是有些基因中内含子和外显子的定义是相对的,与它表达的途径有关。
•在这些基因中,选择性的基因表达模式引起了外显子连接途径的转变。
•一个特定的外显子可能选择性地与不同的外显子连接形成信使RNA 。
•这种选择性形式产生的两种蛋白质中,一部分相同而其他部分不同。
一段区域以一种途径表达时作为外显子,而以另一种途径表达时作为内含子。
•因为此时一段DNA序列通常以多种方式起作用,所以不能被简单地称为外显子或内含子。
第6节基因组一、原核生物的染色体基因组二、真核生物基因组一、原核生物的染色体基因组(一)细菌染色体基因组结构的一般特点1. 细菌的染色体基因组通常仅由一条环状双链DNA分子组成,细菌的染色体相对聚集在一起,形成一个较为致密的区域,称为类核(nucleoid)。
类核无核膜与胞浆分开,类核的中央部分由RNA和支架蛋白组成,外围是双链闭环的DNA超螺旋。
染色体DNA通常与细胞膜相连,连接点的数量随细菌生长状况和不同的生活周期而异。
Fig.Typical bacterial cell●E.coli genome is a single double-stranded DNA molecule of 1. 6 mm.●B ut E. coli is only ~ 2 μm in length●D NA is ~ 1000 larger than the size of the cell!●T his is achieved by super-coiling the DNA.●D NA gyrase旋转酶introduces negative-superhelical twists into the DNA. Thedegree of supercoiling of the chromosome is strictly regulated.Fig.The structure of E.coli nucleoid (图大肠杆菌拟核的结构)2. 具有操纵子(trnascriptional operon)结构, 其中的结构基因为多顺反子(polycistron),即数个功能相关的结构基因串联在一起,受同一个调节区的调节。
数个操纵子还可以由一个共同的调节基因(regulatorygene)即调节子(regulon)所调控。
φX174 D-E-J-F-G-H mRNA 外壳蛋白J、F、G、H组装蛋白D 裂解蛋白EE.coli 色氨酸操纵子 9个顺反子 9个酶真核很少,如18s 5.8s 及28s rRNA 基因3. 在大多数情况下,结构基因在细菌染色体基因组中都是单拷贝。
4. 不编码的DNA部份所占比例比真核细胞基因组少得多。
5.具有编码同工酶的同源基因(isogene)例如,在大肠杆菌基因组中有两个编码分支酸(chorismicacid)变位酶的基因,两个编码乙酰乳酸(acetolactate)合成酶的基因。