系统发育解析
6
系统发育分析
PHYLIP
• PHYLIP是目前广泛使用的系统发育程序
/phylip/software.html
• Washington大学Joe Felsenstein开发 • 可以在Mac, DOS, Unix, VAX/VMS等平台上运行 • 工具包:
protpars protein parsimony DNA sequence parsimony DNA parsimony branch and bound interactive DNA parsimony DNA compatibility DNA maximum likelihood DNA maximum likelihood with clock Protein sequence maximum likelihood Protein sequence maximum likelihood with clock Restriction sites maximum likelihood DNA invariants DNA distance Protein sequence distance Restriction sites and fragments distances Neighbor-Joining and UPGMA method Fitch-Margoliash distance matrix method Fitch-Margoliash distance matrix with clock Bootstrapping/Jackknifing
3
系统发育分析
分析步骤
• 多序列比对
– 通过序列与数据库比对收集同源基因 – 通过文献收集与目标基因相关的同源基因
• 确定取代模型
– 计算序列之间的分歧 – 碱基之间相互取代模型, 序列中不同位点取代的相对速率
• • • • • • • p距离模型 J-C单参数模型 Kimura双参数模型 Tajima-Nei模型 Tamura三参数模型 Tamura-Nei模型 gamma分布的J-C单参数模型,Kimura双参数模型和Tamura-Nei模型
系统发育分析
分析步骤
• 系统树的精确性和统计检验
– 检验法(Bootstrap,Jackknife,permutation) – 参考Treebase网站: /treebase/
原始数据多 序列比对结果 对序列中每个 位置重复抽样, 基于原比对结果 生成多个样本
系统发育分析
贾 斌
1
系统发育分析
系统发育分析
• 突变导致进化发生
– 核苷酸的替代、插入、缺失
• 通过系统发育方法推断或者评估进化和亲 缘关系 • 核苷酸序列/氨基酸序列
– – – – 有统一的性状 序列蕴含的信息量大 便于构建数学模型 可以用于计算进化的速率
2
系统树构建工具
ClustalW Phylip MEGA PAUP RRTree Paml tree-puzzle COMPONENT ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalW /phylip.html /software/Mega2_install.zip /downl.html http://pbil.univ-lyon1.fr/software/rrtree.html /software/paml.html http://www.tree-puzzle.de/tree-puzzle-5.0.zip /rod/cpw.html Web/Windows/Liu nx Windows/Liunx Windows/Liunx Windows/Liunx Windows/Liunx Windows/Liunx Windows/Liunx Windows
4
Байду номын сангаас
系统发育分析
分析步骤
• 构建系统发育树:
– 距离法(UPGMA,Neighbor-joining ) – 最大简约法(Maximum Parsimony methods) – 最大似然法(Maximum Likelihood methods)
方法
统发育树
优点
缺点
序列转化为距离时信息量有丢 失。对分歧明显的序列,很难 对距离进行可靠估计
显示系统发育树的免费软件
NJplot TreeView TreeMap NDE ftp://pbil.univlyon1.fr/pub/mol_phylogeny/njplot/njplotWIN95.exe /rod/treeview/1.6.6/treev 32.zip /rod/treemap.html /rod/NDE/nde.exe Windows Windows Windows Windows
工具
PAUP MEGA PHYLIP
距离法 速度快, 稳健,构建唯一系
简约法 如果树枝短,序列相似性高, 树枝长度变异大时可靠性较低
信息位点多,结果可靠
PAUP MEGA PHYLIP
PAML PAUP MEGA 5 PHYLIP
似然法 以似然率反映数据最支持怎 计算量大
样的系统发育关系 搜索所有可能的系统发育树
– – – – 核苷酸和蛋白质序列数据的分析 序列数据转变成距离数据后,对距离数据分析 对基因频率和连续的元素分析 把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1 的状态)时,对序列进行分析的软件 – 绘制和修改进化树
7
系统发育分析
PHYLIP对核苷酸和蛋白质序列数据构建系统发育树主要工具列表