当前位置:文档之家› 系统发育树构建步骤

系统发育树构建步骤

如何建树
step 1. 将16S rDNA序列在NCBI上进行BLAST比对(/BLAST/) BLAST是目前常用的数据库搜索程序,它是Basic Local Alignment Search Tool的缩写,意为“基本局部相似性比对搜索工具”(Altschul et al.,1990 [62];1997[63])。

国际著名生物信息中心都提供基于Web的BLAST服务器。

BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段,并作为内核向两端延伸,以找出尽可能长的相似序列片段。

首先登录到提供BLAST服务的常用网站,比如国内的CBI、美国的NCBI、欧洲的EBI和日本的DDBJ。

这些网站提供的BLAST服务在界面上差不多,但所用的程序有所差异。

它们都有一个大的文本框,用于粘贴需要搜索的序列。

把序列以FASTA格式(即第一行为说明行,以“>”符号开始,后面是序列的名称、说明等,其中“>”是必需的,名称及说明等可以是任意形式,换行之后是序列)粘贴到那个大的文本框,选择合适的BLAST程序和数据库,就可以开始搜索了。

如果是DNA序列,一般选择BLASTN搜索DNA数据库。

这里以NCBI为例。

登录NCBI主页-点击BLAST-点击Nucleotide-nucleotide BLAST (blastn)-在Search文本框中粘贴检测序列-点击BLAST!-点击Format-得到result of BLAST。

BLASTN结果如何分析(参数意义):
例如:
>gi|28171832|gb|AY155203.1| Nocardia sp. ATCC 49872 16S ribosomal RNA gene, complete sequence
Score = 2020 bits (1019), Expect = 0.0
Identities = 1382/1497 (92%), Gaps = 8/1497 (0%)
Strand = Plus / Plus
Query: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt 60
|||||||||||||||||||||||||||||||||||||||||| ||||||||| |||||
Sbjct: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc--ggggt 58
Query: 61 actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc 120
|| ||||||||||||||||||||||||||||||| | |||||| |||||||||||||
Sbjct: 59 acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc 118
其中,Score指的是提交的序列和搜索出的序列之间的分值,越高说明越相似。

Expect指的是比对的期望值。

比对越好,expect越小,一般在核酸层次的比对,expect小于1e-10,就比对很好了,多数情况下为0。

Identities指的是提交的序列和参比序列的相似性,如上所指为1497个核苷酸中二者有1382个相同。

Gaps指的是一般翻译成空位,指的是对不上的碱基数目。

Strand指的是链的方向,Plus / Minus意味着提交的序列和参比序列是反向互补的,如果是Plus / Plus则二者皆为正向。

挑选与目的菌株具有较近亲源关系的模式种(type strain)序列将这些序列用记事本保存成dna.seq文件。

>M.mulatta
AAGCTTTTCT GGCGCAACCA TCCTCATGAT
>M.fascicularis
AAGCTTCTCC GGCGCAACCA CCCTTA TAA T
step 2. 用CLUSTALX对已知DNA序列做多序列比对
1 双击clustalx.exe运行程序。

2 点File→Load Sequence,打开dna.seq。

3 点ALIGNMENT→Do complete Alignment,在新出现的窗点ALIGNMENT→Do complete Alignment口中点击ALIGN进行比对。

4 点FILE→Save sequence,点击OK。

5 将开始和末尾处长短不同的序列剪切整齐。

这里,因为测序引物不尽相同,所以比对后序列参差不齐。

一般来说,要“掐头去尾”,以避免因序列前后参差不齐而增加序列间的差异。

6 剪切后的文件进行再次比对,点FILE→Save sequence as FASTA格式。

step 3. 用MEGA建立进化树
1 打开Mega程序,转化为mega格式,File-Convert To MEGA Format- C:\temp\ jc-b.fas → C:\temp\ jc-b.meg,关闭Text Editor窗口-(Do you want to save your changes before closing?-Yes)。

2 激活目标文件,Click me to activate a data file- C:\temp\jc-b.meg-OK-(Protein-coding nucleotide sequence data?-No)。

3 Phylogeny-construct Phylogeny -Neighbor-Joining(NJ)
4 Options-Models-Nucleotide: Kimura 2-parameter;
5 d: Transitions+Transversions;
6 Include Sites-Pairwise Deletion
7 Test of Phylogeny-Bootstrap; Replications 1000; Random Seed 64238
8 OK;开始compute,得到结果;
9 Image-Copy to Clipboard-粘贴至Word文档进行编辑。

此外,Subtree中提供了多个命令可以对生成的进化树进行编辑,Mega窗口左侧提供了很多快捷键方便使用;View中则给出了多个树型的模式。

下面只介绍几种最常用的:Subtree-Swap:任意相邻两个分支互换位置;
-Flip:所选分支翻转180度;
-Compress/Expand:合并/展开多个分支;
-Root:定义外群;
View-Topology:只显示树的拓扑结构;
-Tree/Branch Style:多种树型转换;
-Options:关于树的诸多方面的改动。

相关主题