当前位置:文档之家› mega操作过程 多序列比对 进化树

mega操作过程 多序列比对 进化树



➢ The program has been shown to be especially suitable for

aligning divergent sequences with only local similarity.



Block-Based Alignment
Match-Box:
PRRN:
➢ web-based program

http://prrn.ims.u-tokyo.ac.jp/
础 生
➢ Uses a double nested iterative strategy for multiple alignment.

➢ Based on the idea that an optimal solution can be found by

➢ 将序列两两比对时的二维动态规划矩阵扩展到多维矩阵。即用

矩阵的维数来反映比对的序列数目。这种方法的计算量很大,

对于计算机系统的资源要求比较高,一般只有在进行少数的较

短的序列的比对的时候才会用到这个方法


➢ DCA (Divide-and-Conquer Alignment):a web-based

alignment Evaluation):

➢ Progressive alignment method

/software/TCoffee.html
物 信
➢ In processing a query, T-Coffee performs both global and

➢ web-based server

http://www.fundp.ac.be/sciences/biologie/bms/matchbox_su
http://igbmc.u-strasbg.fr:8080/DbClustal/dbclustal.html
基 础
Poa (Partial order alignments):

/poa/







2、Iterative Alignment

说是非常必要的。


➢ 为了便于进行交互式手工比对,通常使用不同颜色表示具有

不同特性的残基,以帮助判别序列之间的相似性。
及 计算机程序自动比对


➢ 通过特定的算法(如穷举法,启发式算法等),由计算机程
序自动搜索最佳的多序列比对状态。
穷举法
穷举法(exhaustive alignment method)

守性极高的残基位点;“.”号代表保守性略低的残基位点。

Progressive Alignment Method
Clustal W 使用

➢ 输入地址:/clustalw/

➢ 设置选项 (next)








Progressive Alignment Method

修正。因为观察到的距离要比真实的进化距离低。

IGNORE GAPS:选择on,序列中的任何空位将被忽视。
➢ 详细说明参见
/clustalw/clustalw_frame.html
Progressive Alignment Method
Clustal W 使用

➢ 输入5个16S RNA 基因序列

AF310602
生 物
AF308147

AF283499
息 学
AF012090

AF447394

➢ 点击“RUN”

Progressive Alignment Method
T-Coffee (Tree-based Consistency Objective Function for

program that is semiexhaustive

http://bibiserv.techfak.uni-bielefeld.de/dca/


启发式算法
启发式算法(heuristic algorithms):
基 础
➢ 大多数实用的多序列比对程序采用启发式算法

(heuristic algorithms),以降低运算复杂度。

local pairwise alignment for all possible pairs involved.

A distance matrix is built to derive a guide tree, which is

then used to direct a full multiple alignment using the
础 生
➢ Clustal程序有许多版本

ClustalW(Thompson等,1994)是目前使用最广泛的多序列

比对程序
息 学
它的PC版本是ClustalX

➢ 作为程序的一部分,Clustal 可以输出用于构建进化
应 用
树的数据。
Progressive Alignment Method
ClustalW 程序:ClustalW 程序可以自由使用
础 生
➢ It places emphasis on block-to-block comparison rather than

residue-to-residue comparison. The sequence regions between

the blocks are left unaligned.

profile scores.
➢ Perhaps the most sophisticated and accurate alignment program
available.
➢ Extremely slow computation.
Progressive Alignment Method
DbClustal:

http://ibivu.cs.vu.nl/programs/pralinewww/

➢ First build profiles for each sequence using PSI-BLAST database

searching.

➢ Each profile is then used for multiple alignment using the
Clustal W 使用

➢ 一些选项说明
础 生
PHYLOGENETIC TREE有三个选项

TREE TYPE:构建系统发育树的算法,有四个个选择none、nj

(neighbour joining)、phylip、dist
息 学 及
CORRECT DIST:决定是否做距离修正。对于小的序列歧异(< 10%),选择与否不会产生差异;对于大的序列歧异,需做出

以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。


➢ 输出格式也可以选择,有ALN、GCG、PHYLIP和GDE等,用户可以

根据自己的需要选择合适的输出格式。
息 学
➢ 用ClustalW得到的多序列比对结果中,所有序列排列在一起,

并以特定的符号代表各个位点上残基的保守性,“*”号表示保
1 2 3 4 5 6 7 8 91
ⅠY D G G A V - E AL


ⅡY D G G - - - E AL


ⅢF E G G I L V E AL



ⅣF D - G I L V Q AV


ⅤY E G G A V V Q AL

表1 多序列比对的定义
表示五个短序列(I-V)的比对结果。通过插入空位,使5个序列中 大多数相同或相似残基放入同一列,并保持每个序列残基顺序不变


随着序列数量的增加,算法复杂性也不断增加。用O

(m1m2m3…mn)表示对n个序列进行比对时的算法复杂性,

其中mn是最后一条序列的长度。若序列长度相差不大,则

可简化成O(mn),其中n表示序列的数目,m表示序列的长
应 用
度。显然,随着序列数量的增加,序列比对的算法复杂性
按指数规律增长。
第二节 多序列比对程序及应用

➢ 在NCBI/EBI的FTP服务器上可以找到下载的软件包。
础 生
ClustalW 程序用选项单逐步指导用户进行操作,用户

可根据需要选择打分矩阵、设置空位罚分等。

ftp:///pub/software/


➢ EBI的主页还提供了基于Web的ClustalW服务,用户可以
基础生物信息学及应用
王兴平
内容


多序列比对

物 信
分子进化分析——系统发生树构建
息 学
核酸序列的预测与鉴定


酶切图谱制作

引物设计


多序列比对









内容:
相关主题