第一节基因操作原理
基因操作(Gene Manipulation)的核心部分为分子克隆(molecular cloning)。
由于政府对基因操作有一定的法律约束,大多数国家对此都有一个精确的法律定义。
比如在英国将基因操作定义为将在细胞外产生的核酸(物质)分子插入到病毒、质粒或其它载体系统中,再整合到那些本来不含该类物质的宿主中,从而形成一种新的可连续繁殖的有机体。
(引自Principles of Gene Manipulation ,Black well Scientific Publications , RW. OLD & SB Primrose , 1985)。
强调外源核酸分子(一般情况下都是DNA)在不同宿主中的繁殖,打破自然种的界限,将来自不相关物种的基因放入一个宿主中是基因操作的重要特征。
另一个特征是繁殖。
这里所说的基因操作并不是一个法律概念,除了包括基因克隆外,还包括基因的表达、调控、检测和改造等与基因研究相关的内容。
本课程就是为了讲述在核酸水平上对基因进行研究所涉及的方法、技术和策略的原理,主要是基本的、通用的原理,对于涉及到具体的学科或领域的原理不在此范围内。
基因操作原理在生物学科发展中具有重要地位。
这门课以前叫“分子克隆Ⅰ”,“分子克隆Ⅱ”为实验课。
但无论叫什么,本门课程到底要讲些什么,它的地位如何?
20 世纪是生物学发展最为迅速的时期,1953年由于认识了DNA 的双螺旋结构,从而揭开了分子生物学研究的热潮。
在整个生物学研究进程或研究层次来说,其发展过程涉及到个体、组织器官、细胞、亚细胞水平,同时由于遗传学的兴起与发展,DNA 作为生命遗传信息的物质基础被确定下来,从而导致分子生物学的诞生。
分子生物学严格来说应是从分子水平或核酸水平上进行研究的生物学,研究生物的生物学现象和本质,如DNA的结构、复制、表达、调控、遗传、变异等。
由于分子生物学的进一步发展,生物学的各个分枝学科都延伸到了分子水平,在这种情况下,传统分子生物学就是一个包罗万象的学科,大的可以说动、植、微生物的分子生物学,小的可以说某些物种的分子生物学,如水稻的分子生物学、链霉菌的分子生物学、芽胞杆菌的分子生物学。
在这种情况下,传统的分子生物学就好象是高级生物化学,阐述基因或者说 DNA(核酸)的静态和动态化学本质。
目前的分子生物学,朝着发育、结构和遗传生物学的方向发展。
如果说传统的分子生物学是静态分子生物学的话,那么这些学科可以说是动态分子生物学,即在分子水平(核酸)上,研究生物的生长、分化、死亡以及遗传和变异的内在规律。
在以上这些研究中,均涉及在DNA 水平的操作,本门课程就是要讲述这相关的原理,为分子生物学的研究服务。
通过分子生物学内在的原理,如 DNA 结构、复制、转录、表达、调控等,讲述研究方法和技术的设计原理。
1.基因及其产物的共线性
基因决定蛋白质的序列组成,是由密码子对应特定氨基酸所决定的。
当一个基因的核苷酸序列与其产物的氨基酸序列是一一对应时,则表明它们是共线性的。
例如,由N 个氨基酸组成的蛋白质,其基因由对应的基因编码区的3N 个碱基组成。
在原核生物中,基因与其产物是共线性的。
这在基因克隆中有重要意义。
2.基因及其产物的非共线性
70年代以来,在真核生物中发现了间断基因(interrupted genes),后来发现这种间断基因在真核生物中普遍存在,也就是后来所说的基因间存在着内含子(intron)。
内含子指真核生物基因中不能翻译成蛋白质的DNA 片段,但可被转录,当两侧序列(外显子)的转录 RNA 被剪接在一起时,就将内含子转录的RNA 从整个转录物中除去。
外显子是指能够翻译成蛋白质的任一间断的基因片段,一个基因可有多个外显子。
内含子并不是一成不变的,具有相对性,对一个 DNA 片段来说,在某个基因中是内含子,但在另一个基因中却可作为外显子。
图 1-1 是从DNA 到蛋白质的流程。
实际上内含子与外显子的概念是相对而言的。
有些内含子可作为其它基因的外显子,它们是彼此不相关的基因,如Yeast 线粒体中的某些基因。
另外基因本身有可变换的表达途径,在一条途径中作为内含子的片段,在另一途径中可作为外显子。
这两条途径产生两种蛋白质,它们的末端是相同的,但其中之一在中央部分有额外的序列,因而这一DNA 区段可以为一种以上的蛋白质编码。
DNA
exon1 intron 1 exon 2 intron 2 exon 3 intron 3 exon 4
转录
Pro-mRNA
exon1 intron 1 exon 2 intron 2 exon 3 intron 3 exon 4
mRNA
翻译
蛋白质
图1-1:真核生物中蛋白质合成过程中外显子和内含子的关系
3.基因的重叠与可变性
DNA 序列在代表蛋白质方面的功能不是单一的,单个 DNA 序列可编码一个以上的蛋白质,这些蛋白在结构上有的是相同的序列重复,也可以是全新的蛋白质。
由单个基因通过在不同部位的起始(或终止)表达而形成两种蛋白质,两个基因也可通过在不同读码中译读 DNA 而共用同一序列。
基因的重叠与可变性也可从重组中得以体现。
例如芽胞杆菌的spoⅣ 基
因片段分布在两个不同区域,当需要发挥作用时,便通过重组而连接在一起。
另外,抗体基因的重组变换以及表面蛋白的产生也同样都表明基因的可重叠性与可变性。
4.启动子
启动子是基因转录过程中控制起始的部位,通常一个基因是否表达,转录起始是关键的一步,是起决定性的。
对大多数基因来说,只要转录起始了,表达一般是可进行的。
启动子又是 RNA 聚合酶的结合位点,不同生物中这个结合(识别)位点是有差异的,同一生物的不同基因之间也有差异。
转录终止子主要有两种,一种依赖ρ因子,另一种不依赖ρ因子。
后者主要是能够形成特定二级结构的 DNA 序列,如茎环结构。
5.基因克隆的通用策略
克隆的概念是广泛的,但基因克隆在一定程度上被等同于基因的分离。
本讲义主要采用这一狭义的概念。
假如从一个原核生物中克隆某基因(1-2kb),它的基本步骤是先用限制性内切酶切割外源 DNA 和载体(质粒 DNA 载体或噬菌体载体),然后连接,转化,构建出基因文库,再筛选。
克隆的简要步骤见图 1-2 。
除了通常的克隆外,还有亚克隆。
初步克隆中的外源片段往往较长,含有许多目的基因片段以外的 DNA 片段,在诸如表达、序列分析和突变等操作中不便进行,因此必须将目的基因所对应的一小段 DNA 找出来,这个过程叫“亚克隆”。
图1-2 原核生物基因克隆的步骤示意图。