第十五章转座子基因组是通过获得新序列以及原有序列重排发展而来的。
新序列的意外引入改变基因组间承载信息的能力。
染色体外元件(Extrachromosomal element)通过调节基因的长度(通常是很短的)来转移信息。
在细菌中,质粒是通过接合作用(见12章),而噬菌体则是通过感染来转移信息(见第11章)。
噬菌体和质粒都会在其复制子(Replicon)中偶尔携带一些宿主基因。
有些细菌中有通过转化作用直接转移DNA的现象。
真核生物中,一些病毒(尤其是逆转录病毒)能够在感染周期内转移遗传物质。
重排(Rearrangement)是由基因组内部程序发起的,例如非互惠(Nonreciprocal)重组是由同源重组时错配导致的。
非互惠重组导致座位的复制或重排(见第4章)。
基因组的序列复制是产生新序列的主要来源。
复制可能继承原来的功能或可能产生新功能,而且,在分子水平上发现独立基因组间差异明显,是由于重组导致了这些多态性(Polymorphism)。
在第4章已经讨论过,微卫星间重组可调整其长度以便使每个基因组都是独特的。
多态性的另一个主要原因是由转移元件转座(Transposon)产生的:它们是基因组中可移动的不连续序列,可在基因组内从一个座位转到另一个座位。
转座子特征是它们并不利用独立元件(如噬菌体或质粒DNA),而只是从基因组的一个位点直接移动到另一个位点,与大多数基因组重构的其它程序不同,转座子不依赖序列供体和接体位点间的任何联系。
转座子非常严格地自我转座到同一基因组的新位点,有时增加一些序列,因此它们可作为基因组间序列转移的内部载体,是基因组内突变的主要来源。
转座子可分两种类型。
本章讨论的转座子与编码蛋白质的DNA序列共存并操纵这些DNA以便使其在基因组内复制自我。
下章讨论的转座子与逆转录病毒相似。
它们通过将RNA转录成DNA拷贝的能力而迁移;DNA拷贝同时被整合进基因组的新位点。
通过DNA移动的转座子在真核和原核生物中都已发现。
每种细菌的转座子都携带编码其自身转座所需酶的基因,但也需要它所驻留基因组的辅助功能(如DNA聚合酶或DNA促旋酶)。
类似的系统也存在于真核生物中,但其有关酶的功能还很清楚。
一个基因组可同时包含功能元件和非功能元件。
通常真核基因组中的主要元件是有缺陷的,它们失去了独立转座的能力,但它们仍可被功能性转座子产生的酶识别而被动专座。
转座元件可直接或间接启动基因组的重排。
•转座元件本身可导致序列的缺失、插入或将宿主序列转到一个新的位点。
•转座子作为细胞重组系统的底物是通过“同源便携区(Portable region of homology)”的功能实现的。
在不同座位(或不同染色体)上同一转座子的两个拷贝可能为相应的重组提供位点。
这种交换会产生缺失、插入、倒置或转座。
转座子的间歇活动似乎为自然选择提供了一个模糊的目标。
这支持了以下观点:转座元件既对表型有积极的作用也有消极作用。
它构成所谓“自私(Selfish)DNA”,只顾自身繁殖。
实际上,转座可作为一个事件考虑,转座子是驻留在基因组内的独立实体,这是与其它细胞重组系统的区别所在。
转座子与基因组的关系可能类似寄生虫与宿主的关系,当转座事件引起非必须基因失活或转座子的数量成为细胞系统的负担时,转座繁殖的元件可能被已有的损伤所平衡。
然而我们必需记住:任何具有选择优势的转座(如基因重排)都将导致携带此活性转座子的基因组优先存活。
15.1 插入序列是简单转座模序转座元件是在细菌操纵子中最先被鉴定的自发插入形式。
这种序列插入抑制了其插入基因的转录和/或翻译。
目前已有许多不同类型的转座元件已被阐明。
最简单的转座子称为插入序列(Insertion sequence,IS,反映了它们是如何被发现的)。
每一种类型都以IS为前缀,后边加上识别的数字(最初的种类被编为IS1-4,后来的种类反映了它们被分离出的历史,但与迄今分离的总数不一致)。
IS元件是细菌染色体和质粒的常规要素。
一个标准E. coli菌株大约包含<10拷贝常规IS元件。
一般用双冒号来表示特异位点插入,例如,λ: :IS1表示一个IS1元件插入噬菌体入。
图15.1 转座子所具有的末端倒转重复能够在靶位点的两翼产生正向重复,图中,靶位点重复5bp。
转座子末端的倒转重复为9bp。
数字1-9表示碱基序列。
IS元件是独立的单元,每个IS元件只编码起始自身转座的蛋白。
各种IS元件在序列上都是不同的,但在结构上有共同特征。
IS转座子插入靶位点前后的结构如图15.1所示。
图中总结了一些普通IS元件的特点。
IS元件以倒转重复(Inverted repeat)序列结尾。
两个重复序列高度同源以致于很难辨别。
如图所示,倒转重复序列的存在意味着两侧的两个相同序列都朝向元件内部。
当IS元件转座时,插入位点的宿主DNA序列被复制。
通过比较复制发生前后靶位点的序列可得知其复制的特性(图15.1)。
在插入位点,IS DNA两侧总有短的正向重复(Direct repeat,本文中“正向”指序列的两个拷贝方向相同,而并非相邻)。
但在原基因中(插入前或后的)靶位点只含有一个重复序列。
如图,靶位点含有ATGCA/ACGT序列,转座后,转座子的任一侧都出现一个重复拷贝。
转座子独立转座事件中重复序列是不同的,但任何IS序列的长度都是固定的(反映其转座机制)。
重复序列的普遍长度为9bp。
IS元件有其结构特征:其末端是倒转重复序列,邻近末端的旁侧存在宿主DNA的短正向重复序列。
在DNA序列中,这种组织类型被认为是转座子的一大特征,根据(Prima facie)印象即可断定:此序列源自转座事件。
多数IS元件在宿主DNA的多个位点插入,但也有些有其偏爱的特异宿主位点。
倒转重复限定了转座子的末端。
末端识别对各种转座子都是相同的。
位于末端的顺式位点突变抑制转座,它可被一种与转座有关的蛋白识别。
这种蛋白称为转座酶(Transposase)。
除IS1外的所有IS元件都含有单一的长编码区,此区从倒转重复序列一端内部起始,在倒转重复序列另一末端之前或之上终止。
此区编码转座酶。
IS1有更复杂的结构,它有两个独立的读码框;在翻译时通过移框(Frameshift作用使两个读码框都被应用,以便产生转座酶。
不同转座元件的转座频率不同。
一般为每代10-3 ~10-4 次/元件。
单个位点的插入频率与自发突变率一致,约为10-5 ~10-7/代。
逆转(通过精确切除IS元件而产生)是不常发生的。
发生率为10-6 ~10-10/代。
比插入频率率低~103倍。
15.2 复合转座子含有IS模序有些转座子除转座功能外还携带抗药性(或其它)标记。
这些转座子以Tn加一个数字表示。
一类大转座子由于中心区携带有抗药性标记(Drug marker),两侧有IS元件“臂”而被称为复合转座子(Composite transposon)。
两臂既可是相同方向,也可(大多数是)相反方向,故含有正向重复臂的复合转座子结构为:左臂>——中心区——>右臂。
如果两臂为倒转重复,结构为:左臂>——中心区——<右臂。
箭头表明臂的方向,两臂用L或R表示转座子基因图上的左或右,关于复合转座子结构更详细的说明如图15.2所示。
它同时也总结了一般复合转座子具有的特征。
因为臂上包含IS模序(Module),每个模序都有以倒转重复序列为末端的一般结构,所以复合转座子也是以同样的倒转重复序列为末端的。
有些转座子中,复合转座子的模序是相同的。
如Tn9(IS1正向重复序列)或Tn903(IS903倒转重复)。
另一些例子中,模序高度同源但不相同。
因此我们能在T10或T5中分辨出L 或R 模序。
一个功能性IS 模序既能转座本身也能转座整个转座子。
若一个复合转座子的模序是一样的,可能每一个都能引起转座,就像Tn9或Tn903的例子一样。
两个模序不同时,它们在功能上可能会有差异。
因此,转座可以完全或主要地依赖模序中的一个,如Tn10和Tn5。
图15.2 复合转座子的中心区携带有标记(如抗药性),两侧有IS 模序。
每个IS 具有短的末端重复。
图15.3 两个IS10单位组成一个复合转座子Tn10,该转座子可移动IS10之间的任何DNA 序列。
如果Tn10是环形分子的一部分,那么IS10末端重复可将环两端任何一端进行转座。
我们假设转座子由两个独立起始的模序结合到中央区而构成。
当IS 元件转座到起始位点附近的受体位点时,两个一致模序可能仍保持一致或者分开。
单模序可转座整个复合转座子的能力解释了双模序保持活力缺乏选择压力的原因。
是什么负责转座一个复合转座子而不是单独模序?当两个模序都有功能时这个问题尤为明显。
例如Tn9中模序为IS1元件,大概每一个元件自身与在转座子中都具有功能。
为什么转座子作为完整的插入序列保存下来?两个IS 元件可转座它们之间的任何序列(包括其自身),图15.3表明如果T10在一个环状复制子中,它们两个模序能位于Tn10起始区tet R 基因旁或此环内其它部分序列旁册。
因此转座既涉及最初的Tn10转座子(被tet R 所标记),又涉及新的含有可变中央区的“插入-转出”转座子的产生。
注意:最初的和新的转座子都含有倒转重复模序,这些模序在中央区附近的任何方向都具有功能,复合转座子的转座频率随两模序间的距离增加而下降。
因此长度依赖性是决定一般转座子大小的因素之一。
支持复合转座子转座的主要动力是对中央区携带的标记的选择。
IS10模序易于在自己周围转移,频率比Tn10高得多。
但Tn10含有tet R 选择标记,因此在选择条件下,完整Tn10转座子相对频率增加许多。
编码转座活性的IS 元件既与创建靶位点有关,又与识别转座子末端序列有关,转座子的末端是转座唯一的基础。
15.3 转座可通过复制和非复制机制如图15.4所示,一个转座子插入到一个新的位点。
它包括靶DNA 的交错断裂,将转座子连接到突出的单链末端和填补缺口。
交错末端的产生和填补解释了靶DNA 在插入位点的正向重复的产生;两条链的两个缺口间的交错决定了正向重复的长度。
所以每个转座子的靶重复特性反应了切割靶DNA 所涉及的酶的几何特点。
图15.4 转座子靶位点两翼的正向重复是因交错切割所产生的突出末端与转座子相连而形成的。
图15.5 复制性转座产生转座子的一个拷贝,由该拷贝插入到受体位点,供体位点序列不变,因此供体和受体位点都有一个拷贝的转座子。
交错末端的使用对于所有方式的转座来说都是普遍的。
但是我们通过转座子移动的机制可以将转座分为三种类型。
•复制型转座(Replicative transposon):在相互作用时,转座子被复制,因此转座实体是原转座子的一个拷贝。
图15.5概述了这种转座的结果。