当前位置:文档之家› 生物信息学概论第三章替换模式

生物信息学概论第三章替换模式

2 300
96.0
9.0 41.8 33.0 76.3
19.6
3.0 8.1 11.5 14.3
3.39
1.86 3.48 3.00 3.60
5’UT
内含子 3’UT 3’端侧翼序列
由上表中,可以揭示的一个普遍规律:
内含子和两端侧翼序列的替换积累速度最快 其次是能转录而不能翻译的序列 最慢的是编码序列
甘氨酸(GGG)->丙氨酸(GCG) 经过详细分析可以发现,基因的编码序列发生同义替 换的概率几乎是异义替换的3倍
并非三联密码子上的所有位置都会发生异义替换。事实 上,三联密码子中的核苷酸可分为3类: 非简并位点:该位点的变异都是导致替换 双重简并位点:该位点有两种不同的核苷酸翻译成 同一种氨基酸,另外两种不同的核苷酸则翻译成不同 的氨基酸 四重简并位点:这一位点上无论是什么,都不会影 响该密码子的翻译
3.1.2 功能约束
自然选择能够杜绝导致生物体生存和繁衍能力下降 的基因变化
那些能够引起蛋白质催化性能及结构特征变化的基因变 化,会更加受制于自然选择。十分重要的基因部分被认 为受功能约束控制,它们在进化过程中趋向于非常缓慢 的变化 另外一些不会对氨基酸序列或表达方式造成影响的基因 变化,很少受到自然选择的纠正,因此这种类型的变化 速度相对较快
复制一条完整的基因可能形成很多复制品,其中一 个提供原基因的必要功能,而其他的复制则积累了不 受自然选择的替换
某个不断变化的复制品会出现一些新的重要功能,于是 这个基因就变得对生物体的适应性非常重要 更多时候复制出来的基因会成为伪基因,因为变异使得 这样的基因丧失了功能,失去了转录的活性。这些基因序列 的替换积累速率相当高,略高于同一物种的基因的3’端侧翼 序列
例:
分类 例子
非简并位点
苯丙氨酸(UUU) 亮氨酸(CUU) 异亮氨酸(AUU) 缬氨酸(GUU) 天冬氨酸(GAU,GAC) 谷氨酸(GAA,GAG) 甘氨酸(GGG,GGA,GGU,GGC)
双重简并位点 四重简并位点
如果自然选择在出现改变蛋白质功能的变异的时候就起作用,那么 很显然,处于四重简并位点的核苷酸替换的积累最为迅速,而处于 非简并位点的替换积累最为缓慢
个体之间发现的许多变异的优势或劣势都不明显,
在本质上是选择中性的。
基因任何中性变异被固定的概率是q
这里q为该等位基因的相对频率
基因任何中性变异最终从种群中消失的可能性为1-q, 尽管基因新变异的固定概率可能很小,中性突变却能 在种群中维持很长的时间,固定新的中性突变的平均时 间实际上相当于繁衍4N代所经历的时间
人、兔类β球蛋白基因编码序列里各种位点的替换率
位点类型 位点数目/bp 302 60 85 替换数目 17 10 20 替换速率(个替换/位 点/10亿年) 0.56 1.67 2.35
非简并位点
二重简并位点 四重简并位点
3.1.4 插入删除情况和伪基因
在有转录活性的基因中,插入删除很难发生。原因 在于插入删除会改变阅读框。DNA和修复酶经过亿万 年的进化,已形成合理的机制,一般会使插入删除比 简单的碱基替换发生的概率小10倍
3.1.5 替换和突变
虽然一个基因核苷酸序列的每一位都可能发生变化,然 而人们没有观察到所有可能的变异,但这个问题却使人 们发现了分子进化研究中突变和替换这两个词在使用上 有趣的数字差异。 突变:是指DNA的复制和修复过程中出现错误而导致 的核苷酸序列的改变
替换:是指了某个层次上经过自然选择过滤后的突变
同义(和伪基因)的替换速率Ks,通常被认为能较好反 映出基因突变时实际速率;而异义替换速率Ka则不然, 因为他们逃脱不了自然选择
3.1.6 等位基因与固定
绝大多数自然界现存的生物种群包含着大量的基因变异, 从而形成等位基因。一个物种某个基因的不同版本被称 之为等位基因。
- 举个例子,人平均每200个碱基对中就有一个不同于其他人。
– 有利的
– 中性的 – 不利的
• 有利的变化实际上只占少数 • 核苷酸序列的某些变化对一个生物体的影响比其他因素更 大
3.1.1 突变率 r = K/(2T)
r:替换速率(突变率)
K: 来源于同一祖先的两个序列之间的替换数量 T:分叉时间 如果不同物种间的进化率是相似的,在没有其他证 据的情况下,通过替换速率(突变率),可以推测进 化事件发生的时间。 比较基因内和基因间的替换速率(突变率)常用来 确定不同基因组区域的作用
等位基因的差异变化很广,从不会产生影响到产生严重 后果。各种等位基因相对频率的改变就是进化的基础 新的等位基因以非常低的频率出现:q = 1/2N
N是这个种群中具有繁殖活性的二倍体的数量
危及生物体生存和繁殖的突变,会在自然选择中,从 基因库里扫地出门,这种突变频率最终降为0
如果等位基因优势突出,其频率就渐渐接近于1,即 该等位基因被固定
分析已经发生的替换数目和性质,对于分子进化 的研究有很重要的意义.
这种分析也为生物信息学的研究人员致力于识别 和刻画具有重要功能的基因部分提供了强有力的 线索。
本章内容
基因内的替换模式 估算替换数目 基因间进化率的变化
分子时钟
细胞器的进化
3.1 基因内的替换模式
• 基因突变:一种核苷酸替换成另一种,以及插入/删除事件
来源与β球蛋白基因的数据,一个核苷酸序列每一 百万年只发生0.35%的改变,对于人类来说这种改变 是非常缓慢的,但是比之分子的进化又是相当迅速的
3.1.3 同义和异义替换
同义替换:改变核苷酸编码序列,但不影响蛋白质 的氨基酸序列的替换 甘氨酸(GGG,GGA,GGU,GGC)
异义替换:改变核苷酸编码序列,同时影响蛋白质 的氨基酸序列的替换
大量分析证实,基因不同部分的变化速度确实千差万别, 而这些速度正反映了不同部分受功能约束的程度
人、鼠、兔、牛的类β球蛋白基因各部分的差异
基因区域类别 所有非编码序列 所有编码序列 5’端侧翼序列 人类/基因区域 替换的平均数量 长度 913 441 67.9 69.2 标准方差 14.1 16.7 替换速率(个替换/ 位点/10亿年) 3.33 1.58
相关主题