中国科学: 生命科学 2011年 第41卷 第2期: 87 ~ 96
SCIENTIA SINICA Vitae www.scichina.com life.scichina.com
英文引用格式: Liu D, Tang W Q, Yang J Q, et al. Recent advancements in Tc1-like transposons. SCIENTIA SINICA Vitae, 2011, 41: 87–96, doi: 10.1360/052010-449 《中国科学》杂志社SCIENCE CHINA PRESS
评 述
类Tc1转座子研究进展
刘东①, 唐文乔①*, 杨金权①, 刘少军② ① 上海海洋大学水产与生命学院, 省部共建种质资源发掘与利用教育部重点实验室, 上海 201306; ② 湖南师范大学生命科学学院, 教育部蛋白质化学及鱼类发育生物学重点实验室, 长沙 410081 ∗ 联系人, E-mail: wqtang@shou.edu.cn
收稿日期: 2010-07-07; 接受日期: 2010-12-24 国家自然科学基金(批准号: 30630051, 30771650)、教育部博士点基金(批准号: 20070264001)、上海市重点学科(批准号: S30701)和上海市教委E-研究院(批准号: E03009)资助项目 DOI: 10.1360/052010-449
摘要 转座子广泛存在于各种生物基因组中, 能在染色体不同位点间转座, 并在基因组中大量
扩增. 转座子的活动能引起生物基因组或基因的重组和变异, 加速生物多样性及其进化速率, 被视
为生物基因组进化的内在驱动. 转座子分2类: 反转座子和DNA转座子. 类Tc1转座子是DNA转
座子超级家族中种类最多、分布最广的一类. 本文简要概述了类Tc1转座子的结构特征, 及其扩增、
转座和迸发的机制, 并展望了其应用和研究方向. 关键词 基因组 转座子 转座酶 类Tc1 进化 真核生物基因组中, 除编码蛋白序列和调控序
列外, 还有许多功能未知的散布重复序列和串联重
复序列. 转座子(transposable element; transposon)是
一种能够迁移的散布重复序列, 广泛存在于各种生
物的基因组中, 其转座酶基因是自然界中最普遍、最
丰富的一种基因[1]. 20世纪20~40年代, McClintock[2]
在研究玉米自交后代的染色体结构变化时, 发现9号
染色体上具有一个可转座的断裂位点(dissociation,
Ds), Ds从原位点解裂后转入种子生色等位基因的邻
近位点, 改变了种子生色基因的表达, 当Ds从邻近
位点转出后, 种子生色基因恢复正常表达, 由此提出
Ds是转座元件的概念. 在染色体间, “跳跃”的转座元
件以一种精准的方式调控基因的表达, 因此被称为
控制因子(controlling elements)或转座子[3]. 转座子具
有两个主要特征: 一是能够从细胞染色体的一个位
点迁移(转座)到另一个位点, 引起生物基因组或基因
的重组和变异, 加速生物多样性和进化速率[4]; 二是
能够在生物基因组中大量扩增拷贝, 是一类“自私基因(selfish gene)”[5]. McClintock[3]创立的转座子理论,
改变了以往人们认为遗传物质是固定排列在染色体
上的观念. 转座子被视为生物基因组进化的内在驱
动[6]. 自1950年首次被报道以来, 转座子理论历经
30余年才被遗传学界所接受[3], 现已成为生命科学
研究的一个热点, 在PubMed文献数据库, 以
“transposable element”可检索出文献>19900篇.
根据转座机理, 转座子分为2类: 由RNA介导
的依靠反转座酶实现转座的Ⅰ类转座子, 或称反转
座子(retransposon); 以DNA形式的转座酶催化转座
的Ⅱ类转座子, 又称DNA转座子[7]. 自然界最普遍
的DNA转座子可能是在线虫(Caenorhabditis elegans)
中发现的Tc1和果蝇(Drosophila)中发现的Mariner,
类似于Tc1和Mariner的转座子在真菌、植物、原生
动物、鱼类、蛙类和哺乳类基因组中均有发现[8]. 比
较分析线虫、昆虫、涡虫(Planaria)和鱼类的类Tc1
和类Mariner, 发现它们具有共同特征, 起源于同一
祖先, 可构成1个Tc1-Mariner超家族[9]. 基于转座子刘东等: 类Tc1转座子研究进展
88 序列和结构的相似性, 真核生物的DNA转座子至少
可分为12个超家族[10,11]. 细菌DNA转座子(称为插
入序列, IS)IS630与Tc1-Mariner具有相似的转座酶催
化中心, 插入位点均为“TA”双核苷酸, 由此组成了1
个IS630-Tc1-mariner(ITm)超家族[12]. 最近, 按照一
种基于转座酶催化中心结构特点的新命名, ITm超家
族可分为包括Tc1, mariner和maT在内的7个家族[13],
其中Tc1家族种类最多、分布最广[14]. 本文将重点阐
述真核生物类Tc1转座子的结构特征, 以及扩增、转
座和迸发的机制, 并展望了其应用和研究方向.
1 结构特征
Tc1最初是作为引起线虫多态性的一个重复序
列而被发现, 也是线虫基因组中首次被鉴定的DNA
转座子[14]. “Tc1”表示第1个来自于线虫的转座子, 与
Tc1具有相似结构的转座子统称类Tc1转座子
(TLEs)[15]. TLEs具有一个编码转座酶基因, 两侧翼为
末端反向重复序列(ITRs). 通常情况下, 由于ITRs的
大小或编码转座酶基因长短差异, 造成了LTEs序列
长度变化, 一般为1200~2400 bp. 每个ITRs内, 一般
有1~2个转座酶结合位点, 位于外侧的结合位点称为
外侧正向重复(ODR), 位于内侧的结合位点称为内侧
正向重复(IDR). 根据ITRs长短和结构特征, TLEs至
少可分为3群[13]. 第一群, ITRs长度<100 bp, 如线虫
的Tc1为54 bp[16], 果蝇的Mos1为28 bp[17], 每个ITR
仅有1个转座酶结合位点; 第二群, ITRs长度为200~
250 bp, 每个ITR有2个转座酶结合位点: ODR和IDR,
因此也称为IR-DR型. 鲑科鱼类分子重组的Sleeping beatuty(SB)就是典型代表[18], 也包括果蝇的Minos[19]
和白端按蚊(Anopheles albimanus)的Quetzal[20]. 两个
DR序列长度较短, 一般为20~40 bp, 间隔序列约为200
bp, 这种结构为该群的一个保守特征. 虽然两个DR能
与转座酶发生连接反应, 但仅ODR参与转座酶的剪
切反应[18]. IR-DR的重复可能是协同进化的结果[21].
第三群, ITRs长度>300 bp, 每个ITR包含2个DR, 两者
的间隔序列约为170 bp. 该群的主要代表为线虫的
Tc3[22]和Tc7[23]. 然而, 也有例外, 如冈比亚按蚊(Ano-
pheles gambiae)中的TsesebeI的5’-ITRs和3’-ITRs长度
为181和183 bp[24]. 以团头鲂(Megalobrama amblyce-
phala)()×♂红鲫(Carassius auratus red var)()♀杂交,
从其F1代的四倍体中鉴定的Tte1转座子, 其5’-ITRs和3’-ITRs长为137和127 bp, 不同于以上类群, 可
能为另一个类群[25].
在无脊椎动物中, LTEs编码转座酶基因, 一般
表现为两种类型, 一种具完整的可读框, 编码活性
的、约340个氨基酸(aa)的转座酶; 一种为可读框缺
失, 或可读框移位, 编码非功能性的转座酶. 转座子
相应地被称为自主转座子(autonomous transposons)和
非自主转座子(non-autonomous transposons)[26], 线虫
的Tc1, Tc3及Tc7等都具这两种类型[14]. 在脊椎动物
中, LTEs转座酶基因普遍具有不同程度的核苷酸插入
或缺失, 造成可读框移位, 或基因序列内包含终止子,
从而丧失了编码转座酶的功能, 如斑马鱼(Danio rerio)
的Tdr1[27]、泥鳅(Misgurnus mizolepis)的MMTS[28]和蚯
蚓(Eisenia Andrei)的EamaT1[29]等具有不同元件. 根
据转座子元件间序列比对, 可推测出LTEs的一致性
序列. Ivics等人[18]从鲑科鱼类中分离出失活的LTEs,
利用分子重组技术消除一致性序列的终止子, 构建
出脊椎动物中第一个具活性的、能在哺乳动物细胞中
转座的SB. Miskey等人[30]重组了蛙(Rana pipiens)的
一个转座子Frog Prince(FP), FP能转座到各种脊椎
动物细胞中. 最近, 从鲽(pleuronectes platessa)基因
组中鉴定的PPTN[31], 也称为Passport, 被发现具有
自然编码完整转座酶的功能, 在哺乳动物细胞中表
现出转座活性, 成为脊椎动物中第1个有自然活性的LTEs[32].
比对分析转座酶Tc1A(343 aa), SB(340 aa),
FP(337 aa), PPTN(340 aa)和转录因子Prd、重组酶
RAG1和Hin的序列发现, 它们具有相似的结构, 包
括N端的一个DNA结合中心, C端的一个催化中心,
N和C端之间的一个二分核定位信号(NLS). N端的
DNA结合中心具有2个“螺旋-转角-螺旋”结构
(HTH)[8]. 第1个HTH与二分转录因子PAIRED(PAI
和RED)的PAI相似, PAIRED通过PAI与DNA特异
性结合; 第2个HTH与PAIRED的RED相似, RED
是PAIRED与DNA结合的核心区; 2个HTH间隔一
个调节PAIRED与DNA结合反应的类GRPR结构[13].
C端保守位点具有2个天冬氨酸(D)和1个谷氨酸(E),
组成了一个“DD34E”催化中心, 第2个D和E间隔了
34 aa[8]. 转座酶具有与转录因子相似的DNA结合域,
表明转座酶通过NLS被运转到细胞核后, 直接识别
并结合转座子的靶位点, 调控转座反应.