当前位置:文档之家› 第一章++基因结构和基因组1

第一章++基因结构和基因组1

11
基因概念的更新和不断发展
重叠基因( 重叠基因(overlapping gene): ) 一个基因的核苷酸与另一个基因的核苷酸之间存 在这一定的重叠现象。 在这一定的重叠现象。 1977年,维纳(Weiner)在研究 病毒的基因结构时,首先发 年 维纳( 病毒的基因结构时, )在研究Q0病毒的基因结构时 现 了 基 因 的 重 叠 现 象 。 1978 年 , 费 尔 ( Feir ) 和 桑 戈 尔 Sangor) 在研究分析φX174噬菌体的核苷酸序列时 噬菌体的核苷酸序列时, ( Sangor ) 在研究分析 φX174 噬菌体的核苷酸序列时 , 也发现 个核苷酸组成的单链DNA所包含的 个基因中有几个基 所包含的10个基因中有几个基 由5375个核苷酸组成的单链 个核苷酸组成的单链 所包含的 因具有不同程度的重叠, 因具有不同程度的重叠, 但是这些重叠的基因具有不同的读码 框架。以后在噬菌体G4、 中都发现了重叠基因。 框架。以后在噬菌体 、MS2和SV40中都发现了重叠基因。基 和 中都发现了重叠基因 因的重叠性使有限的DNA序列包含了更多的遗传信息,是生物 序列包含了更多的遗传信息, 因的重叠性使有限的 序列包含了更多的遗传信息 对它的遗传物质经济而合理的利用,参与对基因的调控。 对它的遗传物质经济而合理的利用,参与对基因的调控。
3
1920年代及1930年代早期Alfred H Sturtevant以Hermann Muller在果蝇研究上,发现基因在染色体上的位置改变 时,尽管基因结构本身不变,其功能却会变化而造成 果蝇性状的突变。实验中,他们将一个基因挪近所谓 异染色质区(heterochromatin)时,果蝇会产生所谓杂 heterochromatin 色(variegated)的表现型,也就是一个基因在某些细 胞会表现,却在某些细胞不会表现,而造成“杂色”, 例如复眼中有些部分呈现白色,有些部分则呈现红色。 由於基因的功能似乎会因应其所在位置而改变,以致 有人甚至认为基因根本不是一个固定而具体的单位 (particulate gene),然而,在实际上却又不能完全否 定"基因"做为遗传单位的概念。
12
暮 已 赏 时 花 醒 归 微 去 力 马 酒 如 飞
13
移动基因( 移动基因(movable gene): ): 又叫转座因子( 又叫转座因子(transposable element),可以从染色体的一个位置 ),可以从染色体的一个位置 ), 转移到另一个位置。 转移到另一个位置。
14
断裂基因( 断裂基因(split gene): )
基因的编码序列在DNA分子上是不连续的, 基因的编码序列在DNA分子上是不连续的,为不编码的序列所隔 DNA分子上是不连续的 20世纪70年代中期 法国生物化学家查姆帮(Chamobon)发现 世纪70年代中期, 发现。 开。20世纪70年代中期,法国生物化学家查姆帮(Chamobon)发现。 1977年被英国的查弗里斯和荷兰的弗兰威尔在研究兔 年被英国的查弗里斯和荷兰的弗兰威尔在研究兔β 1977年被英国的查弗里斯和荷兰的弗兰威尔在研究兔β-球蛋白结 构时所证实。
5
这个“基因包含转录因子结合区”的概念,使基因变 成一个功能性而且可以彼此重叠的概念。意即,一段 DNA序列,可以因对转录因子反应的不同,可以有一 种以上的基因功能,而一个基因的转录序列,可能是 另一个基因的转录调控区。 时至今日,基因的定义已经不再是一段具有明显边界 的固定DNA序列(particulate gene),而是一个具有伸 缩性(flexible)的功能性组合,它的范围是以其(1) 空间结构与位置(2)对特定调控因子的反应(3)对 最终表现型的效果来决定。 根据以上的论述,基因的基本条件有三:1、必须要有 产出(product)2、必须要有功能 3、包含转录区及调 控区。根据这三个条件,我们如何去从漫长的DNA序 列中找出基因呢?以下是五种常用的标准。
4
在最新版的Thompson & Thompson "Genetics in Medicine"(2001),基因的 定义是"A sequence of chromosome DNA that is required for production of a functional product,be it a polypeptide or a functional RNA molecule"。因此当 代对基因的定义除了被转译的DNA序列本身之外,调控此一转译工作的 DNA序列也应包含在内。那麽基因的范畴到底何在? 假若基因是一个比较固定而具体的单位(particulate gene)则我们应该可以 找出界定基因的"区隔"(barrier or insulator)。然而学者费尽心力却遍寻不 着能够区别个别基因的结构。因此,从学者无法找到能够区隔个别基因的 barrier or insulator来看,基因可能是一个相当具有伸缩性的结构。另外一个 观察是,一个基因的功能取决於它对某些转录因子(transcriptional factor) 的反应,而非本身在染色体上的位置,这个现象是Frank Grosveld在人类βglobin locus control region首先观察到。因此基因应该是包含被转录的DNA 序列以及转录因子的结合区。这些转录因子的结合区可以延伸几百个 Kilobase。最近的研究显示人类的DACH基因,其enhancer甚至在远达1Mb的 基因沙漠(gene desert)中。
15
70年代后,基因的概念随着多学科渗透和实验手段日新月异又有突飞猛 进的发展,主要有以下几个方面: 基因具重叠性。1977年桑格(F. Sanger)领导的研究小组,根据大量研 究事实绘制了共含有5375个核苷酸 核苷酸的ΦX174噬菌体DNA碱基顺序图,第 核苷酸 一次揭示了遗传的一种经济而巧妙的编排——B和E基因核苷酸顺序分别 与A和D基因的核苷酸顺序的一部分互相重叠。当然它们各有一套读码结 构,且基因末端密码也有重叠现象(A基因终止密码子TGA和C基因起始 密码子ATG重叠2个核苷酸;D基因的终止密码子TAA与J基因起始密码子 ATG互相重叠1个核苷酸,顺序为TAATG) 内含子和外显子。人们在研究小鸡卵清蛋白基因时发现其转录形成的 mRNA只有该基因长度的1/4,其原因是基因中一些间隔序列的转录物在 RNA成熟过程中被切除了。这些间隔序列叫内含子,基因中另一些被转 录形成RNA的序列叫外显子。小鸡的卵清蛋白基因中至少含7个内含子。 因而从基因转录效果看,基因由外显子和内含子构成。
8
经典遗传学基因的概念:基因具有下列共性:(1)基因具有染 色体的重要特征(即基因位于染色体上),能自我复制,相对稳 定,在有私分裂和减数分裂时,有规律地进行分配;(2)基因 在染色体上占有一定的位置(即位点),并且是交换的最小单位, 即在重组时不能再分割的单位:(3)基因是以一个整体进行突 变的,故它是一个突变单位;(4)基因是一个功能单位,它控 制正在发育有机体的某一个或某些性状,如白花、红花等。 总之,经典遗传学认为基因是一个最小的单位,不能分割,既是 结构单位,又是功能单位。 分子遗传学关于基因的概念:分子遗传学的发展揭示了遗传密码 的秘密,使基因的概念落实到具体的物质上,即基因在DNA分子 上,一个基因相当于DNA分子上的一定区段,它携带有特定的遗 传信息。这类遗传信息或被转录为RNA,包括信使RNA、转移 RNA、核糖体RNA;或者信使RNA被翻译成多肽链。 另一方面,在精细的微生物遗传分析中查明,基因并不是不可分 割的最小单位,而是远为复杂得多的遗传和变异的单位。
假基因( 假基因(pseudogene): ):
是与功能性基因密切相关的DNA序列,但是由于缺失、 是与功能性基因密切相关的DNA序列,但是由于缺失、插入和 DNA序列 无义突变失去阅读框架而不能编码蛋白质产物。1977年 无义突变失去阅读框架而不能编码蛋白质产物。1977年,G·Jacp 在对非洲爪赡5SrRNA基因簇的研究后提出了假基因的概念。 在对非洲爪赡5SrRNA基因簇的研究后提出了假基因的概念。 5SrRNA基因簇的研究后提出了假基因的概念
9
随着现代遗传学的发展,在分子水平上,根据重组、 突变和功能将基因分成3个单位 (1)突变子:就是指 性状突变时产生突变的最小单位。一个突变子可以小 到只有一个碱基对; (2)重组子:就是指性状重组时,可交换的最小单位。 一个交换子可以只包含一个碱基对; (3)顺反子:表示一个起作用的单位,基本符合通常 所述的基因的大小或略小。它包括它包括一段DNA与 一个多肽链合成相对应,平均为500-1500个碱基对。
6
1、Open reading frames(ORF) ORF是指位于start codon与stop codon之间的DNA序列。以ORF寻 找基因较适用于原核生物或其他intron稀少的生物。当生物的exon 被隐藏在大段的intron时,ORF常常不易被找到。 2、Sequence features 分布特征 找出ORF之后,利用基因通常GC较AT多的特征,再加以验证。 另外找寻splice site(AG、GT)可能也有助于基因的辨识。不过 使用这些辨识原则的电脑软件只能预测50%的exon和20%的基因。 3、Sequence conservation 比对不同生物的碱基序列也是辨识基因的利器,理论上,在不同 生物均有的序列(conserved sequence)应该有其功能上的重要性, 本身是基因的机会较大。利用不同生物来比对基因序列,必须这 些生物间有相当的演化距离(evolutionary distance),例如最近 人类六号染色体的基因辨识是利用五种其他生物-大鼠、小鼠、河 豚、绿色斑点河豚以及斑马鱼来进行比对。当然随着所用生物的 不同,比对出来的基因数目也会有所差异。
2
生物的性状是经由遗传单位传递给下一代,这个概念 在1900年由孟德尔(Gregor Mendel)提出,1909年约 翰森(Wilhelm Johanssen)将这个遗传单位的概念冠 上“gene”的名字,汉文将之翻译成“基因”,日本人 则将之翻译成“遗传子”,更为直接。 最早的观念中,基因是前述的“遗传单位”(unit of inheritance)。这是一个比较功能性的概念,它是一个 自主单位(autonomous unit),能把性状遗传给后代。 相对地,有人认为基因是一个有形的物体(physical entity),它是染色体上面一段固定的序列。这两派看 法多年来,各执一词,不相上下。
相关主题