当前位置:
文档之家› 8、生物信息学基因组和基因预测
8、生物信息学基因组和基因预测
18
C value paradox of nucleotide
显花植物 鸟类 哺乳类 爬行类
两栖类
硬骨鱼类 软骨鱼类 棘皮类 甲壳类 昆虫类 软体动物
蠕虫类 霉菌
藻类 真菌 G+细菌 G-细菌 支原体
A 生物体进化程度与大 C值不成明显正相关
B 亲缘关系相近的生物 间大C值相差较大
C 一种生物内大C值与 小c值相差极大
最小C值 (Minimum c value)
The total amount of DNA for encoding the genes information is termed its Minimum c value (编码基因信 息的总DNA含量)
基因组的大小和C值矛盾
某生物单倍体的DNA总量称C值,C值与生物的进化程度不 完全对应。
分散的重复顺序
(40%)
长分散顺序(LINEs)
卫星 DNA(长 100~5000kb)
成簇的重复顺序 小卫星 DNA(长 100bp~20kb,VNTRs)
(60%)
微卫星 DNA(4bp,CA 重复)
图 10-37(b)人类基因组的序列
2、 细菌基因组及其特点
a.细菌的“染色体”通常有一个环状或线型DNA分子组成,只有一个 复制起点。不少细菌含有若干个小的环状DNA,被称作质粒(plasmid)。 有些质粒可以从一个细菌转移到另一个细菌,不少经过改造的质粒在基 因工程中被用作基因转移的载体。
病毒基因组大小相差较大,与细菌或真核细胞相比,病毒的基因组 很小
病毒基因组可以由DNA组成,也可以由RNA组成 多数RNA病毒的基因组是由连续的核糖核酸链组成 基因重叠即同一段DNA片段能够编码两种甚至三种蛋白质分子 病毒基因组的大部分是用来编码蛋白质的 病毒基因组DNA序列中功能上相关的蛋白质的基因或rRNA的基因往
12000 35000
25000
11.3kb 16.3kb
二、典型生物的基因组特征
1、真核生物基因的特点
• 真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核 内,除配子细胞外,体细胞内的基因的基因组是双份的(即双 倍体,diploid),即有两份同源的基因组。
• 真核细胞基因转录产物为单顺反子。一个结构基因经过转录和 翻译生成一个mRNA分子和一条多肽链。
E.coli含有的各种DNA结合蛋白
蛋白 结构
功能
含量/每细 相 当 于 核 基因
胞
蛋白
HU
α 和 β 亚 使DNA压缩、类核 4万个二聚 H2B
hup
基,每个 9KD
凝聚,刺激复制, 和1HF有关
体
A.B
H
两 个 相 同 促 使 双 链 的 互 补 、 3万个二聚 H2A
?
亚基,各 28KD
复性
(Euk. 人体 c = C/10) ( Prok. Φx174 c >C )
某些生物的基因组数据
物种 基因组大小 基因数目 基因长度
ΦX174 λ噬菌体 大肠杆菌
0.7kb 45Kb 4.2Mb
10 100 4200
1.2kb
酿酒酵母 13.5Mb
6300
1.4kb
果蝇 14 Mb
人
3.3Gb
拟南芥 70Gb
DNA from a lysed E. coli cell. In this electron micrograph several small, circular plasmid DNAs are indicated by white arrows. The black spots and white specks are artifacts of the preparation.
Theory of the gene (1926 T. H. Morgan)
• 基因是染色体上的实体
• 基因像链珠(bead)一样,孤立地呈 线状地排列在染色体上 • 基因是:
功能(functional unit) 突变(mutation unit) 交换(cross-over unit)
“三位一体”的 (Three in one)
基因组的大小:C值
C值通常指一种生物单倍体基因组DNA的总量。
最大C值 (Maximum C value) The total amount of DNA in the genome of haploid is a characteristic of each living species known as its Maximum C value (单倍体基因组总DNA 的含量)
病毒是最简单的生物形式,完整的病毒颗粒包括外壳蛋白和 内部的基因组DNA或RNA(有些病毒的外壳蛋白外面有一层由 宿主细胞构成的被膜(envelope),被膜内含有病毒基因编码 的糖蛋白。)病毒不能独立地复制,必需进入宿主细胞中借 助细胞内的一些酶类和细胞器才能使病毒得以复制。外壳蛋 白(或被膜)的功能是识别和侵袭特定的宿主细胞并保护病 毒基因组不受核酸酶的破坏。
基因重叠示意图
乙肝病毒的基因组
1978 Gilbert 真核生物基因的新概念
(2)内含子和外显子
人们在研究小鸡卵清蛋白基因时发现其转录形成的mRNA只 有该基因长度的1/4,其原因是基因中一些间隔序列的转录物 在RNA成熟过程中被切除了 这些间隔序列叫内含子,基因中另一些被转录形成RNA的序 列叫外显子。小鸡的卵清蛋白基因中至少含7个内含子。因而 从基因转录效果看,基因由外显子和内含子构成。
组织特异性基因 tissue-specific gene 特定类型细胞中为其执行特定功能蛋白质编码的基因
(4)基因的游动性 早在20世纪40年代美国遗传学家麦克林托克 (B.McClintock)在玉米研究中发现“转座因子”, 直至1980年夏皮罗(J.Shapiro)等人证实了可移位 的遗传基因存在,说明某些基因具有游动性。为此, 这位“玉米夫人”荣获了1983年度诺贝尔奖
• 基因是DNA分子中含有特定遗传信息的一段核苷酸序 列,是遗传物质的最小功能单位
• 对于编码蛋白质的结构基因来说,基因是决定一条多 肽链的DNA片段
基因的由来
孟德尔(Gregor Johann Mendel 1822~1884),
《植物杂交试验》一文中指出,生物每一个性状都是通 过遗传因子来传递的,遗传因子是一些独立的遗传单位
• 存在重复序列,重复次数可达百万次以上。 • 基因组中不编码的区域多于编码区域。
• 大部分基因含有内含子,因此,基因是不连续的。
• 基因组远远大于原核生物的基因组,具有许多复制起点,而每 个复制子的长度较小。
非编码顺序
基因和 ( > 90%)
基因相
关顺序 编码顺序
(20-30%) (< 10%)
生物信息学 第6讲 基因组学与基因预测
课堂内容
一、基因、基因组的概念 二、典型生物的基因组特征 三、人类基因组计划 四、核酸测序技术 五、基因组测序 六、基因转录组测序 七、基因的功能和预测
一、基因、基因组的概念
1、基因的概念
• 基因是原核、真核生物以及病毒的DNA和RNA分子 中具有遗传效应的核苷酸序列,是遗传的基本单位。
c) 某些转座因子(Tn3)对同类转座因子的插入具有 排他性(免疫性)
d) 靶序列在转座因子两侧会形成正向重复(DR) e) 转座因子的切除与转座将产生复杂的遗传学效应
2、基因组的概念
基因组:细胞内遗传信息的携带者DNA的总体
• 基因组中不同的区域具有不同的功能 • 有些区域编码蛋白质的结构基因 • 有些区域是复制及转录的调控序列 • 有些区域的功能尚不清楚
Hale Waihona Puke DNA转座现象的一般遗传特点:
a) 不依赖 Donor site 与 Target site 间序列的同源性 (非同源重组过程 ,不依赖 recA 酶)
b) 转座插入的靶位点并非完全随机(插入专一型) Hotspots (热点) Regional preference ( 在3kb区域内的随机插入)
①从细胞遗传学的角度来看,基因组是指一个生物物种 单倍体的所有染色体数目的总和; ②从经典遗传学的角度来看,基因组是一个生物物种的 所有基因的总和; ③从分子遗传学的角度来看,基因组是一个生物物种所 有的不同核酸分子的总和; ④从现代生物学的角度来看,基因组是指导一个生物物 种的结构和功能的所有遗传信息的总和,包括全部的基 因和调控元件等核酸分子。
Exon(外显子)is any segment of an interrupted gene that is represented in the mature RNA product. Intron(内含子)is a segment of DNA that is transcribed, but removed from within the transcript by splicing together the sequences (exons) on either side of it.
往丛 集在基因组的一个或几个特定的部位,形成一个功能单位或转录 单元。
除了反转录病毒以外,一切病毒基因组都是单倍体,每个基因在病 毒颗粒中只出现一次。反转录病毒基因组有两个拷贝。
噬菌体(细胞病毒)的基因是连续的;而真核细胞病毒的基因是不 连续的
三、人类基因组计划
人类基因组计划的启动 1986 年诺贝尔奖获得者
Ovalbumin DNA X cDNA
Electro-microscope
7 introns 8 exons
(3)管家基因和奢侈基因 管家基因 house-keeping gene
生物体各类细胞中都表达,对维持细胞存活和生长 所必需的蛋白质编码的基因。如糖酵解和柠檬酸循环 所需酶的编码基因等 奢侈基因 luxury gene