当前位置:
文档之家› mega操作过程 多序列比对 进化树
mega操作过程 多序列比对 进化树
息
➢ The program has been shown to be especially suitable for
学
aligning divergent sequences with only local similarity.
及
应
用
Block-Based Alignment
Match-Box:
PRRN:
➢ web-based program
基
http://prrn.ims.u-tokyo.ac.jp/
础 生
➢ Uses a double nested iterative strategy for multiple alignment.
物
➢ Based on the idea that an optimal solution can be found by
基
➢ 将序列两两比对时的二维动态规划矩阵扩展到多维矩阵。即用
础
矩阵的维数来反映比对的序列数目。这种方法的计算量很大,
生
对于计算机系统的资源要求比较高,一般只有在进行少数的较
物
短的序列的比对的时候才会用到这个方法
信
息
➢ DCA (Divide-and-Conquer Alignment):a web-based
基
alignment Evaluation):
础
➢ Progressive alignment method
生
/software/TCoffee.html
物 信
➢ In processing a query, T-Coffee performs both global and
基
➢ web-based server
础
http://www.fundp.ac.be/sciences/biologie/bms/matchbox_su
http://igbmc.u-strasbg.fr:8080/DbClustal/dbclustal.html
基 础
Poa (Partial order alignments):
生
/poa/
物
信
息
学
及
应
用
2、Iterative Alignment
物
说是非常必要的。
信
息
➢ 为了便于进行交互式手工比对,通常使用不同颜色表示具有
学
不同特性的残基,以帮助判别序列之间的相似性。
及 计算机程序自动比对
应
用
➢ 通过特定的算法(如穷举法,启发式算法等),由计算机程
序自动搜索最佳的多序列比对状态。
穷举法
穷举法(exhaustive alignment method)
应
守性极高的残基位点;“.”号代表保守性略低的残基位点。
用
Progressive Alignment Method
Clustal W 使用
基
➢ 输入地址:/clustalw/
础
➢ 设置选项 (next)
生
物
信
息
学
及
应
用
Progressive Alignment Method
应
修正。因为观察到的距离要比真实的进化距离低。
用
IGNORE GAPS:选择on,序列中的任何空位将被忽视。
➢ 详细说明参见
/clustalw/clustalw_frame.html
Progressive Alignment Method
Clustal W 使用
基
➢ 输入5个16S RNA 基因序列
础
AF310602
生 物
AF308147
信
AF283499
息 学
AF012090
及
AF447394
应
➢ 点击“RUN”
用
Progressive Alignment Method
T-Coffee (Tree-based Consistency Objective Function for
学
program that is semiexhaustive
及
http://bibiserv.techfak.uni-bielefeld.de/dca/
应
用
启发式算法
启发式算法(heuristic algorithms):
基 础
➢ 大多数实用的多序列比对程序采用启发式算法
生
(heuristic algorithms),以降低运算复杂度。
息
local pairwise alignment for all possible pairs involved.
学
A distance matrix is built to derive a guide tree, which is
及
then used to direct a full multiple alignment using the
础 生
➢ Clustal程序有许多版本
物
ClustalW(Thompson等,1994)是目前使用最广泛的多序列
信
比对程序
息 学
它的PC版本是ClustalX
及
➢ 作为程序的一部分,Clustal 可以输出用于构建进化
应 用
树的数据。
Progressive Alignment Method
ClustalW 程序:ClustalW 程序可以自由使用
础 生
➢ It places emphasis on block-to-block comparison rather than
物
residue-to-residue comparison. The sequence regions between
信
the blocks are left unaligned.
用
profile scores.
➢ Perhaps the most sophisticated and accurate alignment program
available.
➢ Extremely slow computation.
Progressive Alignment Method
DbClustal:
基
http://ibivu.cs.vu.nl/programs/pralinewww/
础
➢ First build profiles for each sequence using PSI-BLAST database
生
searching.
物
➢ Each profile is then used for multiple alignment using the
Clustal W 使用
基
➢ 一些选项说明
础 生
PHYLOGENETIC TREE有三个选项
物
TREE TYPE:构建系统发育树的算法,有四个个选择none、nj
信
(neighbour joining)、phylip、dist
息 学 及
CORRECT DIST:决定是否做距离修正。对于小的序列歧异(< 10%),选择与否不会产生差异;对于大的序列歧异,需做出
础
以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。
生
物
➢ 输出格式也可以选择,有ALN、GCG、PHYLIP和GDE等,用户可以
信
根据自己的需要选择合适的输出格式。
息 学
➢ 用ClustalW得到的多序列比对结果中,所有序列排列在一起,
及
并以特定的符号代表各个位点上残基的保守性,“*”号表示保
1 2 3 4 5 6 7 8 91
ⅠY D G G A V - E AL
基
础
ⅡY D G G - - - E AL
生
物
ⅢF E G G I L V E AL
信
息
学
ⅣF D - G I L V Q AV
及
应
ⅤY E G G A V V Q AL
用
表1 多序列比对的定义
表示五个短序列(I-V)的比对结果。通过插入空位,使5个序列中 大多数相同或相似残基放入同一列,并保持每个序列残基顺序不变
物
信
随着序列数量的增加,算法复杂性也不断增加。用O
息
(m1m2m3…mn)表示对n个序列进行比对时的算法复杂性,
学
其中mn是最后一条序列的长度。若序列长度相差不大,则
及
可简化成O(mn),其中n表示序列的数目,m表示序列的长
应 用
度。显然,随着序列数量的增加,序列比对的算法复杂性
按指数规律增长。
第二节 多序列比对程序及应用
基
➢ 在NCBI/EBI的FTP服务器上可以找到下载的软件包。
础 生
ClustalW 程序用选项单逐步指导用户进行操作,用户
物
可根据需要选择打分矩阵、设置空位罚分等。
信
ftp:///pub/software/
息
学
➢ EBI的主页还提供了基于Web的ClustalW服务,用户可以
基础生物信息学及应用
王兴平
内容
基
础
多序列比对
生
物 信
分子进化分析——系统发生树构建
息 学
核酸序列的预测与鉴定
及
应
酶切图谱制作
用
引物设计
基
础
多序列比对
生
物
信
息
学
及
应
用
内容: