当前位置:文档之家› 02 第二章 人类基因

02 第二章 人类基因

在第一个外显子和最后一个外显子的 外侧是一段不被翻译得非编码区,成为侧 翼顺序 ( Flanking Sequence ) ,侧翼 顺序含有基因的调控顺序,包括启动子、 增强子、终止子等。
En
P3 P2 P3
转录起始点 P1 E1 GT
I1 AG
E2 GT
I2 AG
终止密码 E3
5’
5‘UT 起始密码 3’UT AATAAA
来源相同,结构相似,功能相关的基因,称 为基因家族 ( gene family )。基因家族中 的成员可以分布于几条不同的染色体上,也 可以集中在一条染色体上。
基因簇:集中成簇的基因称为基因簇 ( gene cluster ),它们位于同一染色体上 的同一位点。组蛋白基因簇则集群于 7q32-q36。
1 . 高度重复顺序 ( Highly Repetitive Sequence ) 2 . 中度重复顺序 ( Moderately Repetitive Sequence )
1 . 高度重复顺序
重复顺序的长度可以是 2、4、6、8 等几个 bp , 较长的顺序可以达到 200
bp , 但是重复的拷贝次数可以达到 106 以上。
(2)小卫星 DNA 和微卫星DNA 和微卫星DNA
在人类基因组存在着许多串联排 列的DNA序列。6-25个核苷酸串联重 复序列称小卫星DNA;2-6个核苷酸串 联重复序列称微卫星DNA。
(3)反向重复序列
DNA某些部位具有方向相反但序列相同的区 域,有两种情况: 两条互补序列在一条DNA链上反向平排列; 两b
~70%~80%
~20%~30%
编码
DAN
假基因
DNA 片断
内含子非 翻译顺序
串联重复顺序/ 串联重复顺序 或成簇重复顺序
细胞核基因组的简单介绍
每条染色体含1个DNA分子,1个细胞的全 部遗传信息(基因)都编码在线状的DNA分子上。 由于每个体细胞中有2套染色体(2n),故所含的 DNA是由两个基因组(genome)构成。每个单倍 体基因组约含3.2×109bp。人类基因的平均长度为 1-1.5kb,所以基因组以足以编码1.5×106蛋白质, 但实际上编码蛋白质的结构基因只不过5万-10万个, 仅占总基因组的2%-3%。
反向重复顺序 5’ 3’ A T T A A A G G C T C C T T T T G G A G C C T T T T T T T T 3’ T A A T T T C C G A G G A A AAC C T C G G A A A A A A A 5’
模板链
多 G/C
U U U U C·G C·G U·A C·G G·C G·C A· U A· U A· U
(1)短分散元件 人类的 Alu 家族(Alu Family),占人类
基因组的 3%-6%,由 300 bp 构成,在第 170 位附近都有 AGCT 顺序 被内切酶 AluI 所切割 ( AG↓CT ),故而得名。 这些顺序在基因中的重复次数可以达到 30万- 50万次,平均 5kb DNA 就有一个Alu 顺序。
外显子与内含子接头
每个外显子和内含子接头区都有一段高度保 守的一致顺序 ( Consensus Sequence ) ,即内 含子 5’ 末端大多数是 GT 开始,3’ 末端大多数 是 AG 结束。 称为 GT—AG 法则,这是普遍
存在于真核基因中 RNA 剪接得识别信号。
GT
AG
GT
AG
(二)侧翼顺序
外显子:在结构基因中编码氨基酸的顺序的 DNA 外显子 片断 。 内含子:在结构基因中不编码氨基酸顺序的 DNA 内含子 片断。内含子又称为插入顺序 ( Intervening Sequence, IVS )。
真核生物中也有些结构基因没有内含子的。如组 蛋白基因、干扰素基因等。它们大多数都是以基因簇 的形式出现,大多数的酵母结构基因也没有内含子。 内含子在转录出 mRNA 后被剪切掉。 真核生物有内含子,将编码顺序隔开,所以,真 核生物的基因是不连续的基因,又把真核生物的基因 称为 断裂基因(Interrupted Discontinuous Gene)。
关于假基因的最新资料
假基因与内含子、卫星序列、转位因子等一样, 假基因与内含子、卫星序列、转位因子等一样,是冗余 DNA ,从这个意义上说,假基因是功能基因的“弃儿”。但 从这个意义上说,假基因是功能基因的“弃儿” 正是这些看似无用的遗传变异为物种进化提供了丰富的原材 料,从而成为物种进化不可或缺的有用“工具”。 从而成为物种进化不可或缺的有用“工具” 随着人类基因组计划的顺利实施,人们分离、 随着人类基因组计划的顺利实施,人们分离、鉴定新基 因的速度越来越快,对于占人类基因组97%的非表达序列的 因的速度越来越快,对于占人类基因组97%的非表达序列的 研究(只有约3%的人类基因组是由外显子序列组成的),即 研究(只有约 的人类基因组是由外显子序列组成的),即 的人类基因组是由外显子序列组成的), 对所谓“垃圾 的研究正逐步展开, 对所谓“垃圾DNA”的研究正逐步展开,它们在进化方面的作 的研究正逐步展开 用已经得到肯定, 用已经得到肯定,其中对假基因分类中的主移动元件 的研究已成为当今的研究“ (master mobile element)L1的研究已成为当今的研究“热 ) 的研究已成为当今的研究 例导致人类疾病。 点”。到目前为止,共发现8例导致人类疾病。 到目前为止,共发现 例导致人类疾病
2 . 增强子
增强子 ( Enhancer ) 位于真核基因转录起始 点的上游或者下游,它不能启动一个基因的转录, 但是有增强转录的功能,此外,增强子顺序还可 以与特异性细胞因子结合而促进转录。 研究表明,增强子通常有组织特异性,这是 因为不同的细胞核有不同的特异因子于增强结合。 从而对基因得表达有组织、器官、时间不同的调 节作用。
3’
1 . 启动子
A A 1) (1) TATA box : TATA T A T 位于转录起始点得上游-30~50 bp 。位于转录起始点得上游-
处。他决定转录起始点,是RNA聚合酶的结合位点之一。 他决定转录起始点, 聚合酶的结合位点之一。 聚合酶的结合位点之一 C ) , (2) CAAT box : GG CAATCT, 位于转录起始点的上游 T 也是RNA聚合酶得结合位点之一。控制着转 聚合酶得结合位点之一。 -80 ~100 bp 处,也是 聚合酶得结合位点之一 录起始的频率。 录起始的频率。 有两个拷贝,位于CAAT box 的两侧,由 GGCGGG 的两侧, (3) GC box : 有两个拷贝,位于 ) 组成,是一个转录调节区,有激活转录得功能。 组成,是一个转录调节区,有激活转录得功能。 包括以下几种顺序冷促进转录得进行。 启动子 ( Promoter )包括以下几种顺序冷促进转录得进行。
第二章 人类基因
第一节 基因的基本概念 第二节 基因的化学本质 第三节 人类基因和基因 组的结构特点
第一节 基因的基本概念
孟德尔的遗传因子 摩尔根的基因 一个基因一种蛋白质 一个基因一条多肽链 基因一定编码蛋白质的氨基酸种类和顺序吗? 基因一定要被转录吗?
现代基因的概念
基因是具有特定功能的DNA片段。 片段。 基因是具有特定功能的 片段 形状的改变一定要有基因的改变吗? 形状的改变一定要有基因的改变吗? 表观遗传学 调控基因的改变 基因的修饰
基因家族:基因家族的成员并不是集群排列 成为基因簇,而是散布在基因组中的不同位置,但 编码一组功能紧密相关的蛋白质。人类的类 α、β 珠蛋白基因簇分别串联排列与 16p13 和 11p15 上。
4. 假基因 ( Pseudogene )
在基因家族中的某些成员不产生有功能的基 因产物,这类基因称为假基因 ( pseudogene ), 例如,珠蛋白基因簇中的 ψ α。假基因最初也 是有功能的,后来由于缺失、倒位、或者是点突 变等原因使这些基因成为没有功能的基因。 假 基因可以与有功能的基因连锁,散在分布于有功 能基因中间。
其余的DNA顺序包括基因之间的间隔顺序、 基因内插入顺序、重复顺序等。目前,对它们的 功能知之甚少,绝大多数重复顺序只不过是过剩 的DNA。但是,其中一些则有着特殊的功能, 包括:调节基因的表达,增强同源染色体之间的 配对和重组,维持染色体结构,调节前mRNA的 加工以及参与DNA的复制等。
(二)重复顺序
二、真核基因的分子结构特点
编码区: 编码区:外显子和内含子 启动子 非编码区: 非编码区:侧翼顺序 增强子 终止子
En P3 P2 P3
转录起始点 P1 E1 GT
I1 AG
E2 GT
I2 AG
终止密码 E3
5’
5‘UT 起始密码 3’UT AATAAA
3’
Intron) (一)外显子和内含子(Exon and Intron) 外显子和内含子(
多 A/T
发夹状结构
5’
AUU
UUUUU
3’
2 . 中度重复顺序
Moderately Repetitive Sequence
中度重复顺序的长度在 300-7000 bp 之间,拷贝数在 102 - 105 。中度重复顺 序一般不是编码顺序。据认为在基因中起 着重要的调控作用,包括开启和关闭基因, 促进和终止转录,DNA 复制的起始,参与 mRNA 的加工等。
第二节 基因的化学本质
DNA RNA
第三节 人类基因和基 因组的结构特点
一、染色体的分子组成 二、真核基因的分子结构特点
一、染色体的分子组成
单一顺序( (一) 单一顺序( unique sequence ) (二) 重复顺序( repetitive sequence ) 重复顺序( 多基因家族( (三) 多基因家族( multigene family ) (四) 假基因 ( pseudogene )
(2)长分散元件 Kpn l 家族 ( Knpnl Family ), 被内切酶 Kpn l 所切割约占基因组的 3%-6% , 由 3000 ~ 4000 bp 个拷贝 组成,其功能不详。
相关主题