当前位置:文档之家› 进化树的构建

进化树的构建

烦请各位看看,有没有什么大的问题,请直接贴上你的意见和建议,我会尽快修改。

主要是针对初学者,写得尽量简单一些。

谢谢!phylogentics_lylover.doc (73.0k)lz还真勤劳,一个字:顶Amazing!Thank you for your hard work!oldfish的批评意见也一并上传。

写得不错。

呵呵phylogentics_lylover_with_comments.doc (105.5k)晕,出丑了...改过来了。

谢谢再贴一个来自yzwpf 的批评意见。

写得很不错。

NJ,ML,Bayes均需要选择模型,对PAUP和MrBayes而言,ModelTest有专门的版本可自动选择模型,意味着它会输出两者专用的设置模型的命令,用户需要的只是将该命令简单的复制粘贴。

MrBayes和MAC5均可利用gap信息构建进化树。

ml法无需比对应该是错误的。

至少在paup中未比对会出错。

计算基因分化的年代,这个更一般的是知道进化树中某两个或更多物种的分歧时间,然后可以使用r8s软件分析进化树中其他序列的分歧时间。

在mega中打开树后也可进行极为简单的年代分析,但必须满足分子钟假设且无法根据多个分歧时间进行校正!>楼主,这是我写的帖子呀!怎么变成了mediocrebeing,呵呵!NJ,ML,Bayes均需要选择模型,对PAUP和MrBayes而言,ModelTest有专门的版本可自动选择模型,意味着它会输出两者专用的设置模型的命令,用户需要的只是将该命令简单的复制粘贴。

MrBayes和MAC5均可利用gap信息构建进化树。

ml法无需比对应该是错误的。

至少在paup中未比对会出错。

计算基因分化的年代,这个更一般的是知道进化树中某两个或更多物种的分歧时间,然后可以使用r8s软件分析进化树中其他序列的分歧时间。

在mega中打开树后也可进行极为简单的年代分析,但必须满足分子钟假设且无法根据多个分歧时间进行校正!1Mega的功能:▲数据输入▲排序功能数据处理▲密码子分析▲序列综合编辑▲序列阅读▲Substitution Pattern Homogeneity Test 单因子模式替换分析▲遗传距离▲选择测试▲分子钟▲进化树构建▲距离矩阵▲系统树分析2Bioedit的功能:序列处理和编辑功能▲用于序列处理和编辑的简单的图形界面▲使用编辑选项包括残基的select and drag 选择和拖动和grab and drag 抓取和拖动变量选择选项鼠标点击插入和删除缺口全框选择全屏编辑中剪切复制和粘贴编辑窗口的自动刷新。

▲固定序列框保护排列中的固定残基▲自动的和手动的注解序列使用一个模板序列自动注解同一排列中的其他序列。

▲序列分组分为各个颜色编码家族为同步手动排列锁定组成员。

▲根本的多基因树图阅读器支持节点翻转和打印。

▲链接多基因树图到排列并保存到BioEdit格式排列文件。

▲在ABI自动序列模型377 373 3700中显示打印和编辑ABI痕迹文件在版本2和3中有SCF文件就象用Licor序列输出文件。

RNA比较分析功能▲ RNA比较分析工具包括共变,可能配对和互交信息分析。

▲使用鼠标指示的动态数据视图的互交信息输出2 D矩阵图表,关于互交信息矩阵行和框的互交式的1 D图表。

▲用BioEdit或GanBank格式保存序列注解信息。

▲通过氨基酸翻译排列蛋白质编码核酸序列在排列中搜索保存的残基寻找好的PCR目标或帮助定义基序。

▲在核酸或蛋白质序列中搜索用户定义的基序或用通配符搜索精确的文本并选择包括或忽略缺口。

▲使用自动更新的排列蛋白质全标题和GenBank区域信息进行ClustalW多序列排列。

▲基本序列处理在文档之间复制粘贴序列翻译和还原编码RNA DNA RNA 反转/互补,大写字母/小写字母。

▲多文档界面最多同时打开20个文档但是在其他打开的窗口不能设置限制六框翻译核酸序列为Fasta格式ORF表用矢量图进行半自动质粒矢量绘图和注解自动酶切位点和位置标记自动多接头视图和用户控制绘图工具将质粒文件保存为可编辑的矢量图形文件如位图复制到其他图形程序并可以打印氨基酸和核苷酸成分摘要和图表Revert to Saved 恢复保存和undo 撤销功能编辑氨基酸和核酸序列简单的指定色彩表编辑蛋白质和核酸序列使用不同的色彩表排列易感的描影法以信息为根据其中包括排列位置BioEdit 能够读写GenBank, Fasta, NBRF/PIR, Phylip 3.2 和Phylip 4格式能够读ClustalW 和GCG格式.10个附加格式的导入输出过滤器使用Don Gilbert的ReadSeq导入/添加一个文件到最后的另一个文件上(不考虑文件格式)基本的多文本编辑器限制性内切酶图谱用于任何或所有形式的翻译复酶和输出选项包括酶的提供者和环状DNA选项游览限制性内切酶创造商自动连接到你喜欢的网页游览器如Netscape 或Internet Explorer。

Paup的功能:PAUP(简约法和其他方法的亲缘分析)是由简约法、最大似然法和距离法用于亲缘分析的程序,为系统发育分析提供一个简单的,带有菜单界面的,与平台无关的,拥有多种功能(包括进化树图)的程序。

▲管理数据(排除元素、删除分类)▲定义假设(增加元素权重、设置元素类型、保存当前假设、重新打开假设)▲查找树(定义最佳标准、定义查找策略)、打印树(显示树、描述树、打印低决议树、打印高决议树)▲设置最优标准为距离依靠法(设置最优标准、显示距离、构建邻位相连树、建立最小平方树)、可能性法(设置最优标准、评价简约性树、设置可能性模式参数、开始查找树)▲在批文件中提交命令(四)、DAMBE的功能:单倍型归纳,基因频率和碱基组成分析,遗传距离计算,序列排序,其中以单倍型归纳最为常用。

▲ DNA and protein sequence editing DNA和蛋白质序列的编辑▲ DNA sequence conversion DNA序列的格式转换▲ Multiple sequence alignment, alignment editing and analysis多序列比对,序列编辑和分析▲ Phylogenetic tree analysis系统发生树分析▲ Dot-matrix comparison of DNA or protein sequences DNA或蛋白质的点矩阵比较▲ DNA sequence assembly and editing DNA序列装配编辑▲ Generating BLAST documents for accessing the BLAST E-mail Server产生BLAST文档,以供联系BLAST的E-mail服务器▲ Enhanced motif search in sequence and database在序列和数据库方面增强了主题搜索的功能▲ Restriction analysis限定分析▲ Drawing sequence maps with publication-quality 以公众出版物的质量画出序列的分析图▲ Restriction pattern prediction模式限定▲ Electronic cloning 模拟的无性繁殖系化▲ Reconstructing restriction maps from restriction fragments从已定的碎片中重建DNA的限制性分析图▲ Silent mutation analysis to create/destroy restriction sites沉默的转变分析▲ Directed mismatch to create/destroy restriction sites有指导的修正错配碱基▲ Translation and codon usage analysis密码子分析及其翻译▲ Protein hydrophobic/hydrophilic profile analys is蛋白质亲水/疏水基团的分析▲ Protein characterization: sequence composition and prediction of isoelectric point.蛋白质描述:序列合成和等电点预测▲ Protein secondary structure prediction蛋白质的二级结构预测▲ Reverse translation反转录▲ Design of PCR and sequencing primers PCR反应的引物设计▲ Characterization of thermodynamic properties of DNA or primer sequences DNA或引物序列的热力学特征分析▲ Mispriming analysis底物分析▲ Management of oligo, DNA and protein databases DNA和蛋白质的数据库管理▲ Generation of random sequences随机序列的产生▲ Internet access with integrated Web browser自动连接到你喜欢的因特网浏览器▲ Multi-processing to unleash computer power计算机扩展Fasta格式:Fasta格式,又叫Person(Fasta的主要作者)格式,是最简单的格式,使用最多。

A sequence in FASTA format begins with a single-line description, followed by lines of sequence data. The description line is distinguished from the sequence data by a greater-than (">") symbol in the first column. It is recommended that all lines of text be shorter than 80 characters in length.Fasta格式先以一单行的描述开始,后接序列的详细数据。

FASTA格式第一行是描述行,第一个字符必须是“>”字符;随后的行是序列本身,一般每行序列不要超过80个字符,回车符不会影响程序对序列连续性的看法。

序列由标准的IUB/IUPAC氨基酸和核酸代码代表;小写字符会全部转换成大写;单个“-”号代表不明长度的空位;在氨基酸序列里允许出现“U”和“*”号;任何数字都应该被去掉或换成字母(如,不明核酸用“N”,不明氨基酸用“X”)。

相关主题