当前位置:文档之家› 分子进化与系统发育分析

分子进化与系统发育分析


同源关系的分析
1.直系同源物的确定:Reciprocal Best Hits; 2. 旁系同源物的确定:BLAST,序列比对及数据
库搜索,至少存在一个共有的功能结构域; 3. 整体分析/蛋白质家族分析:系统发育树的构建;
Reciprocal Best Hits
?
直系同源物:Reciprocal Best Hits
Xenolog (异同源物):由某一个水平基因转移事件而 得到的同源序列。
Convergent evolution: 通过不同的进化途径获得相似 的功能,或者,功能替代物。
paralogs orthologs
异同源物
基因的趋同进化
通过不同的进化过程获得保守的功能
趋同进化:Langur
食叶猴
RNASE: 纤维素分解、消化
A. 编码区:阳性选择 1%;中性进化:80%;阴性进 化:19%;
tRNA & Anticodon
1. 每一个密码子,对应 一个tRNA;
2. tRNA通过Anticodon 来识别codon,联系 mRNA和氨基酸序列的 合成;
3. 密码子的使用偏好: 由密码子对应的tRNA的 进化及丰度来决定。
碱基出现的频率
1. 假如:每个核苷酸位点上的替代是随机发生的, 则A,T,C,G出现的频率应该大致相等;
第一节 密码子偏好及相应分析
1. 密码子(codon): 在随机或者无自然选择的情况 下,各个密码子出现频率将大致相等。
2. 密码子偏好:各个物种中,编码同一氨基酸的不 同同义密码子的频率非常不一致;
3. 可能的原因:密码子对应的同功tRNA丰度的不 同。
标准密码子
大肠杆菌RNA聚合酶
大肠杆菌RNA聚合酶 (2)
1. 密码子偏好非常明显;例如 2. 同为编码Phe的同义密码子UUU和UUC,二者
出现的次数显著不等,UUU(15次),UUC(44次); 3. 再如:编码Arg的四个密码子CGU, CGC, CGA,
CGG, 出现次数分别为:89,46,1,0. 4. 提示:对应CGG的同功tRNA可能不存在!
人类迁移的路线
(2) 同源性分析->功能相似性
Ortholog (直系同源物):两个基因通过物种形成的事 件而产生,或,源于不同物种的最近的共同祖先的 两个基因,或者两个物种中的同一基因,一般具有 相同的功能。
Paralog (旁系同源物):两个基因在同一物种中,通 过至少一次基因复制的事件而产生。
(Transversion); 3. 基因复制:多基因家族的产生以及伪基因的产生;
A. 单个基因复制 – 重组或者逆转录; B. 染色体片断复制; C. 基因组复制;
(1) DNA突变的模式
替代
插入
缺失
倒位
(2) 核苷酸替代:转换 & 颠换
1. 转换:嘌呤被嘌呤 替代,或者嘧啶被嘧 啶替代;
2. 颠换:嘌呤被嘧啶 替代,或者嘧啶被嘌 呤替代;
生物信息学
第六章 分子进化与系统发育分析
生物学家:We have a dream…
1. Tree of Life: 重建所有生物的进化历史并以系 统树的形式加以描述
梦想走进现实:How?
1. 最理想的方法:化石!—— 然而…零散、不完整
2. 比较形态学和比较生理学:确定大致的进化框 架。—— 然而,细节存在巨多的争议
2. 大分子功能与结构的分析:同一家族的大分子,具有相 似的三级结构及生化功能,通过序列同源性分析,构建系 统发育树,进行相关分析;功能预测;
3. 进化速率分析:例如,HIV的高突变性;哪些位点易发 生突变?
(1) Tree of Life: 16S rRNA
Out of Africa
53个人的线粒体基因组(16,587bp)
2. 实际情况:DNA受到自然选择的压力,各个位 点的碱基出现频率并不相等;
3. 需要解决的问题:
A. 每个位点上受到什么样的选择压力? B. 各个位点的碱基频率反映了什么样的规律?
4. 表征/统计的方法:计算G+C的含量,并进行 比较;
分子进化的理论
1. 阳性选择,适应性进化,达尔文进化:DNA分
子显著出现非同义替代,改变编码蛋白质的氨基酸组成,
并产生新的功能; 2. 阴性选择,净化选择:DNA分子的同义替代显著,
较少改变蛋白质的氨基酸组成,其原来的功能高度保守;
3. 中性进化:同义替代与非同义替代比例相当,突变不
好不坏,不改变或轻微改变蛋白质的功能。
同义替代 vs. 非同义替代
GCGGTTTGGGAG
(3) HIV protease: 高突变性
Ka/Ks >> 1, 强的正选择压力,具有很高的可突 变性
本章内容提要
1. 密码子偏好及相应分析; 2. 氨基酸序列的进化演变; 3. DNA序列的进化演变; 4. 同义与非同义的核苷酸替代; 5. 系统发育树的构建; 6. 分子钟与线性树; 7. MEGA软件的使用;
基因复制:单个基因复制
重组 逆转录
基因复制:染色体片段复制
基因复制:基因组复制
S. Cerevisiae (酿酒酵母) K. Waltii (克鲁雄酵母)
研究结果: 克鲁雄酵母 中的同源基 因数量与酿 酒酵母相比 为1:2
分子进化研究的目的
1. 从物种的一些分子特性出发,构建系统发育树,进而了 解物种之的生物系统发生的关系 —— tree of life; 物种 分类;
GCGGTCTGCGAC 64个密码子,编码20个氨基酸
GTT
CGT
GTC
CGC
GTA
GTG 脯氨酸P
组氨酸 H
四倍简并
二倍简并
TGG TGC
色氨酸 W 半胱氨酸 C
同义替代
非同义替代
编码区 vs. 非编码区
1. 编码区:DNA上编码功能性的基因的部分; 2. 非编码区:或称基因组序列,绝大部分无功能; 3. 选择压力:
第三种方案:分子进化
1. 1964年,Linus Pauling提出分子进化理论; 2. DNA & RNA: 4种碱基;蛋白质分子:20种氨基
酸; 3. 发生在分子层面的进化过程:DNA, RNA和蛋白
质分子; 4. 基本假设:核苷酸和氨基酸序列中含有生物进化
历史的全部信息;
分子进化的模式
1. DNA突变的模式:替代,插入,缺失,倒位; 2. 核苷酸替代:转换 (Transition) & 颠换
相关主题