当前位置:文档之家› 构建分子进化树

构建分子进化树


monkey
dog hamster bovine
PQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN
LQVRDVELAGAPGEGGLQPLALEGALQKRGIVEQCCTSICSLYQLENYCN PQVAQLELGGGPGADDLQTLALEVAQQKRGIVDQCCTSICSLYQLENYCN PQVGALELAGGPGAGG-----LEGPPQKRGIVEQCCASVCSLYQLENYCN
生物信息学
第五章
多序列对位排列和进化分析 ( I)
多序列对位排列
Multiple Sequence Alignment (MSA)
chicken
xenopቤተ መጻሕፍቲ ባይዱs human
PLVSS---PLRGEAGVLPFQQEEYEKVKRGIVEQCCHNTCSLYQLENYCN
ALVSG---PQDNELDGMQLQPQEYQKMKRGIVEQCCHSTCSLFQLESYCN LQVGQVELGGGPGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN
Using ClustalX for multiple sequence alignment
by Jarno Tuimala
两种工作模式:
Multiple Alignment
Profile Alignment
第一步:输入序列
File
Load sequences
1、序列为多重fasta格式(可进行编 辑,保存为txt文件)
Clustal使用方法
Clustal:目前应用最广泛的 MSA 方法
可在线分析
可在本地计算机运行 序列输入、输出格式
Input FASTA
NBRF/PIR EMBL/SWISSPROT ALN GCG/MSF GCG9/RSF GDE
/
>sequence 1 ATTGCAGTTCG CA …… >sequence 2 ATAGCACATCG CA…… >sequence 3 ATGCCACTCCG CC……
guinea pig PQVEQTELGMGLGAGGLQPLALEMALQKRGIVDQCCTGTCTRHQLQSYCN
Bring the greatest number of similar characters into the same column of the alignment
为什么要做MSA?
Gene tree
a b
A B
Species tree
c
C
We often assume that gene trees give us species trees
为什么要做MSA?
Contig assembly
怎么做MSA?
动态规划算法(dynamic programming):MSA 改进算法(heuristic algorithm):
3、为便于识别 每条序列,可在 >后输入物种名 称,并用空格和 其它描述内容分 开,如: 2、序列文件所在路径不能有空格和 中文字符(如放在系统桌面),否则 ClustalX无法载入
>Human gi|301129180|ref|NP_001180303.1| resistin [Homo sapiens]
用于描述一组序列之间的相似性关系,以便了解一个基因家族 的基本特征,寻找motif,保守区域等。用于预测新序列的二 级和三级结构,进而推测其生物学功能。
Find out which parts “do the same thing”
为什么要做MSA?
用于描述同源序列之间的亲缘关系的远近,应用到分子进化 分析中。是构建分子进化树的基础。
/Tools/msa/clustalw2/
粘贴或上载序列
调整参数 多序列对位排列结果 Alignments
Result Summary
/Tools/msa/clustalw/help/
Clustal离线分析方法(ClustalX) 下载安装 自带Help文件
可进一步对排列好的序列进行修饰(2)
ESPript 多种修饰 功能,突出相同或相似位点 http://espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi 在EBI ClustalW结果网页下载“Alignments”(CLUSTALW format)
Output ALN
NBRF/PIR GCG/MSF PHYLIP NEXUS GDE/FASTA
Clustal W/X算法基础
两两比对 构建距离矩阵
构建指导树 (guide tree)
将距离最近的两条 序列用动态规划的 算法进行比对; “渐进”的加上其 他的序列
Clustal在线分析方法(ClustalW) EBI的ClustalW分析网页
第二步:设定比对参数
第三步:进行序列比对,得到结果
第四步:评价比对质量
打开比对结果: 1、可在ClustalX中直接输出打印 2、可用写字板打开aln文件
3、可将aln文件以图形展示,更直观
更改参数、手动编辑,使之具有生物学意义
可进一步对排列好的序列进行修饰(1)
Boxshade 突出相同或相似位点 (/software/BOX_form.html)
1. 渐进法(progressive methods):Clustal, T-Coffee, MUSCLE 2. 迭代法(iterative methods):PRRP, DIALIGN 3. 其它算法:Partial Order Algorithm、profile HMM、 meta-methods (MAFFT)… /Tools/msa/ Current Opinion in Structural Biology 2006, 16:368–373
在EBI ClustalW结果网页复制序列比对结果
在“Boxshade”网页粘贴序列,在“Input sequence format”栏目选择“ALN”,在“Output format”栏目 选择“RTF_new”
在结果网页点击“here is your output number 1”
修饰过的排列结果
相关主题