当前位置:
文档之家› 第七章分子系统发育分析 进化树
第七章分子系统发育分析 进化树
基本假设 核酸和蛋白质序列中含有生物进化历史的全部信息
理论 分子进化速率恒定。 分子钟:物种的同源基因之间的差异程度与它们的共同祖先 的存在时间(即两者的分歧时间)有一定的数量关系。
发生在分子层面的进化过程:DNA, RNA和蛋白质分子
引言
分子钟成立的证据:
1、至少某些生物大分子(如珠蛋白)的进化速率在相 当长的地质时间内的相对稳定、均匀;
d
a
b
d
c
考虑4个分类群时,共有3种可能的无根树
系统进化树的种类
——有根树、无根树
#Taxa
3 4 5 6 7 … 30
无根树
1 3 15 105 945
有根树
3 15 105 945 10,395
~3.58X1036 ~,选出真实树的拓扑结构十分困 难,因此,目前算法都为优化算法,不能保证最优解。
53个人的线粒体基因组(16,587bp)
人类迁移的路线
第二节 系统进化树及其构建
系统进化树的概念 系统进化树的种类 系统进化树的构建
系统进化树的概念
所有生物都可以追溯 到共同的祖先,生物 的产生和分化就像树 一样生长、分叉,以 树的形式来表示生物 之间的进化关系是非 常自然的事。
eukaryote
a b c da c b da d b c a b c da c b d a d b c b a c db c a d b a a c c a b dc b a d c d a b d a b cd b a c d c a b
考虑4个分类群时,共有15种可能的有根树
a
ca
b
b
dc
Inferred pairwise nucleotide substitutions among 17 mammal species from seven gene products, as estimated from protein studies, plotted against date of divergence, as estimated from the fossil record. The line is drawn from the origin through the oldest point (marsupial / placental divergence at 125 MYBP). The strong linear relationship suggests that molecular differences between pairs of species are proportional to the time of their separation, rather than the degree of organismal difference. Therefore, measures of genetic divergence can be used to date the time of divergence for species pairs for which no fossil data are available: genes function as Molecular Clocks. (from A. C. Wilson 1976)
系统进化树的种类
——标度树、非标度树
标度树:分支的 长度表示变化的 程度
Bacterium 1
Bacterium 2
一个单位
Bacterium 3
Eukaryote 1
Eukaryote 2
Eukaryote 3
Eukaryote 4
非标度树:分支 只表示进化关系, 支长无意义
Bacterium 1 Bacterium 2 Bacterium 3 Eukaryote 1 Eukaryote 2 Eukaryote 3
2、许多不同物种的多种同源大分子在相当长时间内的 平均进化速率近似恒定。
建立分子钟的大致步骤
1、选择所要比较的生物大分子种类
根据具体研究目标和已掌握的资料,选择进化速率相对恒定、速率 大小合适、分布范围能涵盖各待比较物种的生物大分子。
2、选择所要比较的物种,确定各比较组合及其所代表的进 化事件
D C F GA B E†
系统进化树的概念
直系同源(orthologs): 同源的基因是由于共同的祖先基因 进化而产生的。
旁系同源(paralogs): 同源的基因是由于基因复制产生的。 用于分子进化分析中的序列必须是直系同源的,才能真实
反映进化过程。
旁系同源
直系同源
系统进化树的种类
A. 单个基因复制 – 重组或者逆转录 B. 染色体片断复制 C. 基因组复制
(1) DNA突变
替代
插入
Thr Tyr Leu Leu
Thr Tyr Leu Leu
ACC TAT TTG CTG
ACC TAT TTG CTG
ACC TCT TTG CTG Thr Ser Leu Leu
人、马——0.810-9/AA.a 人、鲤鱼——0.610-9/AA.a
分子进化速率远远比表型进化速率稳定
生物大分子进化的保守性
保守性
功能上重要的大分子或大分子的局部在进化速率上明显低于那些在功 能上不重要的大分子或者大分子局部。
(引起表型发生显著改变的突变发生的频率要低于无明显表型发生显 著改变得突变发生的频率。)
拓扑结构:
有根树: 反映时间顺序
——有根树、无根树
bacteria outgroup外围支
root
archaea archaea archaea
eukaryote eukaryote
eukaryote eukaryote
无根树: 反映距离
archaea
archaea
archaea
eukaryote
eukaryote eukaryote
系统进化树的概念
phylogenetic tree/evolutionary tree 系统进化树/生物进化树/系统发育树/系统发生树/系统
树/进化树/演化树 是表明被认为具有共同祖先的各物种相互间进化关系的
树形图。
系统进化树的概念——术语
分支/世系:长度对应 演化距离(如估计的 演化时间)
末端节点:代表最终分类, 可以是物种,群体,或者蛋 白质、DNA、RNA分子等
A
B
C
D 祖先节点/树根
内部节点/分歧点,该
E
分支可能的祖先节点
系统进化树的概念
进化树分支的图像称为进化的拓扑结构 理论上,一个DNA序列在物种形成或基因复制时,
分裂成两个子序列,因此系统进化树一般是二歧 的。
A BC D F G E†
最理想的方法:化石!—— 零散、不完整
引言
梦想走进现实:How?
比较形态学和比较生理学:确定大致的进化框架 —— 细节存很多的争议
引言
梦想走进现实:How?
第三种方案:分子进化
1964年,美国进化生物学家 E. Zuckerkandl和 量子化学家 Linus Pauling提出分子进化理论
缺失 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TAT TGC TGThr Tyr Cys -
ACC TAC TTT GCT G Thr Tyr Phe Ala
倒位 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TTT ATG CTG Thr Phe Met Leu
3、获得生物大分子一级结构的资料
4、获得有关的代表性进化事件发生的地质时间数据
5、通过比较大分子一级结构,选择合适的数学模型,计算 得到进化产生的分子差异d,通过回归分析等统计方法得到 大分子的进化速率r(t)
6、由此可以推断未知进化事件的发生时间
Example: Molecular clock for 17 mammal species
适用序列有很高相似性时
2. 距离法 (distance)
适用序列有较高相似性时
3. 最大似然法 (maximum likelihood, ML)
可用于任何相关序列集合
计算速度:
距离法 >最大简约法 >最大似然法
构建系统进化树的方法 ——最大简约法(MP)
理论基础为奥卡姆 (Ockham)原则:计算所需替代数最小 的那个拓扑结构,作为最优树
核苷酸替代:转换 & 颠换
1. 转换:嘌呤被嘌呤 替代,或者嘧啶被嘧 啶替代
2. 颠换:嘌呤被嘧啶 替代,或者嘧啶被嘌 呤替代
(2)基因复制:单个基因复制
重组 逆转录
(2)基因复制:染色体片段复制
狒狒 人
(2)基因复制:基因组复制
S. Cerevisiae (酿酒酵母) K. Waltii (克鲁雄酵母)
Eukaryote 4
系统进化树的种类
——物种树、基因树
物种树:代表一个物种或 群体进化历史的系统进化 树,两个物种分歧的时间 为两个物种发生生殖隔离 的时间
基因树:由来自各个物种 的一个基因构建的系统进 化树(不完全等同于物种 树),表示基因分离的时 间。
基因分裂
基因分裂 基因分裂 物种分裂
分子途径研究生物进化的可行性
普适性
由4种核酸组成
分子水平的进化表现为:DNA序列的演化、氨基酸序列演化、 蛋白质结构及功能的演化
可比较性
比较不同物种的有关DNA序列
建立DNA序列的演化模型、氨基酸序列的演化模型
蛋白质结构的演化模型
基因组包含丰富的编码信息
与形态、性状包含的信息相比,基因组序列、蛋白质序 列包含更多、更复杂的信息结构