当前位置:文档之家› 系统发育分析方法

系统发育分析方法


据,使得获得的每一个拓扑 特定的替代的模,远缘 参数统计的最小方差, 都计算似然函数,计算
结构的似然率都为最大值, 序列
在进化模型确定的情况 量大,耗时时间长。依
然后再挑出其中似然率最大
下,ML法是与进化事实 赖于合适的替代模型,
的拓扑结构作为最优树。
吻合最好的建树算法.
BI
基因进化模型的统计推论法,
常见软件
软件名称 DNAMAN BioEdit
DNASTAR MAFFT Muscle
ClustalX
Gblocks jModelTest, ModelTest, ModelGenerator
PHYLIP MEGA PAUP PHYML, PAML, RAxdobe Illustrator
近缘序列物种序列的数 目≤12.
善于分析某些特殊的分 子数据如插入、缺失等 序列有用。
只适于序列数目N≤12。 存在较多回复突变或平 行突变时,结果较差。 变异大的序列会出现长 枝吸引而导致建树错误。
ML
依赖于某一个特定的替代模
很好的统计学基础,大
型来分析给定的一组序列数
样本时似然法可以获得 所有可能的系统发育树
系统发育树构建的过程
序列拼接 (Mega) 多序列比对 (MAFFT)
进化模型的选择 (ModelTest) 系统发育树的构建 (RAxML, MrBayes, PAUP) 系统发育树显示和编辑 (FigTree, Adobe Illustrator)
• BioEdit • Mega • Seqman • Contig • Sequencer
通过后验概率直观反映出各 分支的可靠性而不需要自检
大而复杂的数据集
法检验
具有坚实的数学和统计 对进化模型比较敏感,
学基础,可以处理复杂 后验概率是建立在许多
和接近实际情况的进化 假说上,在现实中可能
模型
不成立
系统发育树构建的软件
/phylip/software.html
转换文件格式
hsearch addseq=random nreps=1000; roottrees outroot=monophyl; savetrees brlens=yes file=MP.tre; pscores ALL/ci=yes tl=yes hi=yes rc=yes ri=yes khtest=yes;
用途
序列分析的综合工具 序列分析的综合工具 序列分析的综合工具 多重序列比对工具 多重序列比对工具 图形化的多序列比对工具;构建N-J系统树 冗余序列处理工具 进化模型选择工具 集成的进化分析工具 图形化、集成的进化分析工具 集成的进化分析工具 ML建树工具 基于贝叶斯方法的建树工具 进化树显示工具 进化树显示和编辑工具
序列拼接
多序列比对
http://mafft.cbrc.jp/alignment/server/
速度: Muscle>MAFFT>Clustal 比对准确性:MAFFT>Muscle>>Clustal
比对前
MAFFT 7.0 online alignment
http://mafft.cbrc.jp/alignment/server/index.html
Run 文件
bootstrap nreps=1000 Keepall=yes / AddSeq=random nreps=10; roottrees outroot=monophyl; savetrees file=BT.tre from=1 to=1 savebootp=both maxdec=0;
end;
.....
3.打开paup软件,打开Nexus文件然后运行即可。
4. 运行界面。MP树运行完后,点击“Stop”,继续运行BT树。
运行结果文件:
MP树
BT树
P-buffer 文件
RAxML建树
• 程序自带的文件: raxmlHPC、 raxmlHPC-PTHREADS、 run 三个 • 准备文件两个:phy格式的比对好的序列, txt格式的partition文件
二、基于特征符方法 Character based (Tree searching) methods
Maximum parsimony (MP) Maximum likelihood (ML) Bayesian inference (BI)
方法
NJ
MP
基本特征
适用范围 优点
缺点
不需要分子钟假设,是基于
PAUP软件使用流程 (系统树构建)
1. 将比对后的fasta格式文件转换成Nexus格式 2. 将paup命令粘贴到Nexus文件下方,在命令程序中指定外群, 保存。
begin paup;
log file=p_buffer.txt; pset collapse=minbrlen; [ctype 1.5_1:all;] set maxtrees=5000 increase=no; outgroup ****; set criterion=parsimony;
假设少,树的构建相对
最小进化原理,进行类的合 远缘序列,进化距离不 准确,计算速度快,只 序列上的所有位点等同
并时,不仅要求待合并的类 大,信息位点少的短序 得一颗树,可以分析较 对待,且所分析的序列
是相近的,而且要求待合并 列
多的序列,运行速度优 的进化距离不能太大
的类远离其他的类。
于最大简约法
基于进化过程中碱基替代数 目最少这一假说,不需要替 代模型,对所有可能的拓扑 结构进行计算,并计算出所 需替代数最小的那个拓扑结 构,作为最优树
系统发育分析方法
刘芳 2015.12.11
系统发育分析常用方法
一、基于距离方法 Distance based (Algorithmic) methods
unweighted pair group method with arithmetic mean (UPGMA) Neighbor-Joining Method (NJ) Minimum Evolution (ME) Fitch-Margoliash Method (FM)
相关主题