当前位置:文档之家› 中国科技大学系列生物信息学PPT参考

中国科技大学系列生物信息学PPT参考


7. 将突变概率矩阵转化为PAMn矩阵。
2021/3/10
授课:XXX
8
例6:PAM矩阵的构建
已知3个蛋白质家族若干保守序列片段:
➢家族一:FKILK,FKIKK,FFILL,FFIKL ➢家族二:IIFFF, IIFIF , IKFFL , IKFIL ➢家族三: KIFKK,KIFLK,KLFKL,KLFLL
基酸 I 0.001786 0.003571 0.992857 0.001786
L 0.0125 0.002083 0.002083 0.983333
2021/3/10
15
Step6: 计算PAM1计分矩阵
由突变率mij计算计分矩阵中的分值rij:
rij1l0gm i(j/fi)
将rij = rji取平均值,再取整数; (按先前假设, rij = rji)
e.g.
mKK = 1- mK = 0.9875 mKF = mF × 1/4 = 0.001389 …
2021/3/10
14
Step5:氨基酸一步转移概率矩阵
氨基酸突变概率——一步转移概率矩阵M1ij
原氨基酸
K
Fቤተ መጻሕፍቲ ባይዱ
I
L
K 0.9875 0.001563 0.001563 0.009375 替换氨 F 0.001389 0.994444 0.002778 0.001389
生物信息学
第三章 序列比对 Ⅱ
2021/3/10
授课:XXX
1
本章内容提要
第一节:数学基础:概率及概率模型 第二节:双序列比对算法的介绍
➢Dot matrix ➢动态规划算法
(Needleman-Wunsch, Smith-Waterman算法)
➢FASTA和BLAST算法
第三节:打分矩阵及其含义 第四节:多序列比对
2021➢/3/1B0 LOSUM矩阵 授(B课L:OXXcX ks SUbstitution Matrix)
4
2, PAM系列矩阵
Margaret Dayhoff, 1978; 通过对物种进化的研究,根据一种氨基酸被
另一种氨基酸替代的频度而提出的,最常用 的是PAM250; Accepted point mutation (PAM): 可接受 的点突变,氨基酸的改变不显著影响蛋白质 的功能;
结构域性质计分: ➢ SGM矩阵(Structure-Genetic Matrix) 主要根据氨基酸的结构和化学性质的相似程度 来记分(如D和E,S和T,V和I有很高的相似性),同 时还考虑密码子之间相互转换的难易程度。
可观测变换计分:
➢ PAM矩阵 (Point Accepted Mutation)
2021/3/10
授课:XXX
5
PAM矩阵
71个蛋白质家族的1572种变化; 序列相似性 > 85%;
功能同源的蛋白质 通过中性进化,引入 可接受的点突变;
进化模型:
➢A. 基本假设:中性进化,Kimura,1968;
➢B. 进化的对称性: A->B = B->A;
➢C. 扩展性:通过对较短时间内氨基酸替代关系 的计算来计算较长时间的氨基酸替代关系;
➢家族二,家族三

2021/3/10
11
Step3:计算氨基酸间的转换次数
计算每种氨基酸转换成其它氨基酸的次数。 假设两种氨基酸间相互转换一样。
K
F
I
L
K
1
1
6
F
1
2
1
I
1
2
1
L
6
1
1
➢e.g. N(LK)= 3 + 0 + 3 = 6
2021/3/10
12
Step4:计算各氨基酸相对突变率
每种氨基酸相对突变率mi
mi
氨基酸i总共发生替换数 总替换数2 fi100
i:第i种氨基酸;
fi :每种氨基酸出现的频率;
mK = 8/(12×2× fK ×100) = 0.0125 …
2021/3/10
13
Step5:计算氨基酸i替换为j的突变率
氨基酸i替换为j的突变率mij
i j时, mij mi氨 氨基 基ji酸 总 酸 与j相 共互 发替 生换 替的 换次 数 i j时, mii 1mi
按Doyhoff方法构建PAM1与PAM2矩阵
2021/3/10
授课:XXX
9
Step1:多重比对
位置对齐,多重比对(不考虑空位):
家族一 FK I LK FK I KK FF I LL FF I KL
家族二 I I FFF I IFIF I KFFL I KF I L
家族三 K I FKK K I FLK KLFKL KLFLL
2021/3/10
授课:XXX
2
第三节 打分矩阵及其含义
1,计分方法 2,Dayhoff: PAM系列矩阵 3,Henikoff: BLOSUM系列矩阵
2021/3/10
授课:XXX
3
1, 计分方法
匹配计分: ➢ UM矩阵(Unitary matrix) 相同的氨基酸记1分,否则记0分。 ➢BLAST中核酸比对
7
PAMn矩阵的构建
1. 选取多个家族的相似性>85%的保守序列;
2. 根据匹配计分进行多重比对(不含空位);
3. 以比对结果构建进化树,反映氨基酸替换关 系;
4. 计算每种氨基酸转换成其它氨基酸的次数;
5. 计算每种氨基酸突变率;
6. 计算每对氨基酸突变率,得到突变概率矩阵 ,将此矩阵自乘n次;
rKK = 10lg(mkk/ fk) = 5.6857 ≈ 6 (rKF + rFK )/2 = -22.833 ≈ -23 …
2021/3/10
16
Step6: PAM1计分矩阵结果
三个家族序列片段得到的PAM1计分矩阵:
K
F
I
L
K
6
F
-23
5
I
-22
-19
6
L
-13
-22
-20
2021/3/10
授课:XXX
6
PAM1矩阵
两个蛋白质序列的~1%氨基酸发生变化; 定义进化时间以氨基酸的变异比例为准,
而不是时间;因为各个蛋白质家族进化的速 度并不相等; PAM2 = PAM1*PAM1 PAM3 = (PAM1)3 PAM250= (PAM1)250
2021/3/10
授课:XXX
统计每种氨基酸出现的频率; fi = 氨基酸i的数目/总氨基酸数目
fL = 12/60 = 0.2 ..
2021/3/10
10
Step2:构建进化树
最大简约法
➢家族一:
FKILK
(LK)
(KF)(LK)
FKIKK
FFIKL
FFILL (LK)
FKIKK
FFIKL
L和K间相互转换次数:N(LK) = 3
相关主题