当前位置:文档之家› 类Tc1转座子研究进展

类Tc1转座子研究进展

中国科学: 生命科学 2011年 第41卷 第2期: 87 ~ 96

SCIENTIA SINICA Vitae www.scichina.com life.scichina.com

英文引用格式: Liu D, Tang W Q, Yang J Q, et al. Recent advancements in Tc1-like transposons. SCIENTIA SINICA Vitae, 2011, 41: 87–96, doi: 10.1360/052010-449 《中国科学》杂志社SCIENCE CHINA PRESS

评 述

类Tc1转座子研究进展

刘东①, 唐文乔①*, 杨金权①, 刘少军② ① 上海海洋大学水产与生命学院, 省部共建种质资源发掘与利用教育部重点实验室, 上海 201306; ② 湖南师范大学生命科学学院, 教育部蛋白质化学及鱼类发育生物学重点实验室, 长沙 410081 ∗ 联系人, E-mail: wqtang@shou.edu.cn

收稿日期: 2010-07-07; 接受日期: 2010-12-24 国家自然科学基金(批准号: 30630051, 30771650)、教育部博士点基金(批准号: 20070264001)、上海市重点学科(批准号: S30701)和上海市教委E-研究院(批准号: E03009)资助项目 DOI: 10.1360/052010-449

摘要 转座子广泛存在于各种生物基因组中, 能在染色体不同位点间转座, 并在基因组中大量

扩增. 转座子的活动能引起生物基因组或基因的重组和变异, 加速生物多样性及其进化速率, 被视

为生物基因组进化的内在驱动. 转座子分2类: 反转座子和DNA转座子. 类Tc1转座子是DNA转

座子超级家族中种类最多、分布最广的一类. 本文简要概述了类Tc1转座子的结构特征, 及其扩增、

转座和迸发的机制, 并展望了其应用和研究方向. 关键词 基因组 转座子 转座酶 类Tc1 进化 真核生物基因组中, 除编码蛋白序列和调控序

列外, 还有许多功能未知的散布重复序列和串联重

复序列. 转座子(transposable element; transposon)是

一种能够迁移的散布重复序列, 广泛存在于各种生

物的基因组中, 其转座酶基因是自然界中最普遍、最

丰富的一种基因[1]. 20世纪20~40年代, McClintock[2]

在研究玉米自交后代的染色体结构变化时, 发现9号

染色体上具有一个可转座的断裂位点(dissociation,

Ds), Ds从原位点解裂后转入种子生色等位基因的邻

近位点, 改变了种子生色基因的表达, 当Ds从邻近

位点转出后, 种子生色基因恢复正常表达, 由此提出

Ds是转座元件的概念. 在染色体间, “跳跃”的转座元

件以一种精准的方式调控基因的表达, 因此被称为

控制因子(controlling elements)或转座子[3]. 转座子具

有两个主要特征: 一是能够从细胞染色体的一个位

点迁移(转座)到另一个位点, 引起生物基因组或基因

的重组和变异, 加速生物多样性和进化速率[4]; 二是

能够在生物基因组中大量扩增拷贝, 是一类“自私基因(selfish gene)”[5]. McClintock[3]创立的转座子理论,

改变了以往人们认为遗传物质是固定排列在染色体

上的观念. 转座子被视为生物基因组进化的内在驱

动[6]. 自1950年首次被报道以来, 转座子理论历经

30余年才被遗传学界所接受[3], 现已成为生命科学

研究的一个热点, 在PubMed文献数据库, 以

“transposable element”可检索出文献>19900篇.

根据转座机理, 转座子分为2类: 由RNA介导

的依靠反转座酶实现转座的Ⅰ类转座子, 或称反转

座子(retransposon); 以DNA形式的转座酶催化转座

的Ⅱ类转座子, 又称DNA转座子[7]. 自然界最普遍

的DNA转座子可能是在线虫(Caenorhabditis elegans)

中发现的Tc1和果蝇(Drosophila)中发现的Mariner,

类似于Tc1和Mariner的转座子在真菌、植物、原生

动物、鱼类、蛙类和哺乳类基因组中均有发现[8]. 比

较分析线虫、昆虫、涡虫(Planaria)和鱼类的类Tc1

和类Mariner, 发现它们具有共同特征, 起源于同一

祖先, 可构成1个Tc1-Mariner超家族[9]. 基于转座子刘东等: 类Tc1转座子研究进展

88 序列和结构的相似性, 真核生物的DNA转座子至少

可分为12个超家族[10,11]. 细菌DNA转座子(称为插

入序列, IS)IS630与Tc1-Mariner具有相似的转座酶催

化中心, 插入位点均为“TA”双核苷酸, 由此组成了1

个IS630-Tc1-mariner(ITm)超家族[12]. 最近, 按照一

种基于转座酶催化中心结构特点的新命名, ITm超家

族可分为包括Tc1, mariner和maT在内的7个家族[13],

其中Tc1家族种类最多、分布最广[14]. 本文将重点阐

述真核生物类Tc1转座子的结构特征, 以及扩增、转

座和迸发的机制, 并展望了其应用和研究方向.

1 结构特征

Tc1最初是作为引起线虫多态性的一个重复序

列而被发现, 也是线虫基因组中首次被鉴定的DNA

转座子[14]. “Tc1”表示第1个来自于线虫的转座子, 与

Tc1具有相似结构的转座子统称类Tc1转座子

(TLEs)[15]. TLEs具有一个编码转座酶基因, 两侧翼为

末端反向重复序列(ITRs). 通常情况下, 由于ITRs的

大小或编码转座酶基因长短差异, 造成了LTEs序列

长度变化, 一般为1200~2400 bp. 每个ITRs内, 一般

有1~2个转座酶结合位点, 位于外侧的结合位点称为

外侧正向重复(ODR), 位于内侧的结合位点称为内侧

正向重复(IDR). 根据ITRs长短和结构特征, TLEs至

少可分为3群[13]. 第一群, ITRs长度<100 bp, 如线虫

的Tc1为54 bp[16], 果蝇的Mos1为28 bp[17], 每个ITR

仅有1个转座酶结合位点; 第二群, ITRs长度为200~

250 bp, 每个ITR有2个转座酶结合位点: ODR和IDR,

因此也称为IR-DR型. 鲑科鱼类分子重组的Sleeping beatuty(SB)就是典型代表[18], 也包括果蝇的Minos[19]

和白端按蚊(Anopheles albimanus)的Quetzal[20]. 两个

DR序列长度较短, 一般为20~40 bp, 间隔序列约为200

bp, 这种结构为该群的一个保守特征. 虽然两个DR能

与转座酶发生连接反应, 但仅ODR参与转座酶的剪

切反应[18]. IR-DR的重复可能是协同进化的结果[21].

第三群, ITRs长度>300 bp, 每个ITR包含2个DR, 两者

的间隔序列约为170 bp. 该群的主要代表为线虫的

Tc3[22]和Tc7[23]. 然而, 也有例外, 如冈比亚按蚊(Ano-

pheles gambiae)中的TsesebeI的5’-ITRs和3’-ITRs长度

为181和183 bp[24]. 以团头鲂(Megalobrama amblyce-

phala)()×♂红鲫(Carassius auratus red var)()♀杂交,

从其F1代的四倍体中鉴定的Tte1转座子, 其5’-ITRs和3’-ITRs长为137和127 bp, 不同于以上类群, 可

能为另一个类群[25].

在无脊椎动物中, LTEs编码转座酶基因, 一般

表现为两种类型, 一种具完整的可读框, 编码活性

的、约340个氨基酸(aa)的转座酶; 一种为可读框缺

失, 或可读框移位, 编码非功能性的转座酶. 转座子

相应地被称为自主转座子(autonomous transposons)和

非自主转座子(non-autonomous transposons)[26], 线虫

的Tc1, Tc3及Tc7等都具这两种类型[14]. 在脊椎动物

中, LTEs转座酶基因普遍具有不同程度的核苷酸插入

或缺失, 造成可读框移位, 或基因序列内包含终止子,

从而丧失了编码转座酶的功能, 如斑马鱼(Danio rerio)

的Tdr1[27]、泥鳅(Misgurnus mizolepis)的MMTS[28]和蚯

蚓(Eisenia Andrei)的EamaT1[29]等具有不同元件. 根

据转座子元件间序列比对, 可推测出LTEs的一致性

序列. Ivics等人[18]从鲑科鱼类中分离出失活的LTEs,

利用分子重组技术消除一致性序列的终止子, 构建

出脊椎动物中第一个具活性的、能在哺乳动物细胞中

转座的SB. Miskey等人[30]重组了蛙(Rana pipiens)的

一个转座子Frog Prince(FP), FP能转座到各种脊椎

动物细胞中. 最近, 从鲽(pleuronectes platessa)基因

组中鉴定的PPTN[31], 也称为Passport, 被发现具有

自然编码完整转座酶的功能, 在哺乳动物细胞中表

现出转座活性, 成为脊椎动物中第1个有自然活性的LTEs[32].

比对分析转座酶Tc1A(343 aa), SB(340 aa),

FP(337 aa), PPTN(340 aa)和转录因子Prd、重组酶

RAG1和Hin的序列发现, 它们具有相似的结构, 包

括N端的一个DNA结合中心, C端的一个催化中心,

N和C端之间的一个二分核定位信号(NLS). N端的

DNA结合中心具有2个“螺旋-转角-螺旋”结构

(HTH)[8]. 第1个HTH与二分转录因子PAIRED(PAI

和RED)的PAI相似, PAIRED通过PAI与DNA特异

性结合; 第2个HTH与PAIRED的RED相似, RED

是PAIRED与DNA结合的核心区; 2个HTH间隔一

个调节PAIRED与DNA结合反应的类GRPR结构[13].

C端保守位点具有2个天冬氨酸(D)和1个谷氨酸(E),

组成了一个“DD34E”催化中心, 第2个D和E间隔了

34 aa[8]. 转座酶具有与转录因子相似的DNA结合域,

表明转座酶通过NLS被运转到细胞核后, 直接识别

并结合转座子的靶位点, 调控转座反应.

相关主题