当前位置:文档之家› 生物信息学2016-9-序列比对

生物信息学2016-9-序列比对


Liaoning University
课堂练习题
1. 练习课件中的例子1-5 2. 使用ClastalX和MEGA比对载脂蛋白D(P05090),人视黄醇结合蛋 白4(P02753),孕激素相关子宫内膜蛋白(P09466),补体8 (γ肽)(P07360),lipocalin1(P31025),人气味结合蛋白 2A(Q9NY56), α-1微球蛋白(P02760),嗜中性明胶酶相关蛋 白(P80188),前列腺素D2合成酶(P41222)。并找到序列中的 保守氨基酸。括号中为蛋白的UNIPROT ID,根据此ID可在UNIPROT 网站中下载蛋白质序列。 3. 使用ClastalX和MEGA比对自己下载到的细菌ITS序列。注意在MEGA 中选择序列类型为DNA序列。
/ (下载网站)
Bioinformatics
Liaoning University
例子3:使用Clustal Omega比对人RBP4蛋白,小鼠RBP4蛋 白,鸡RBP4蛋白,猪RBP4蛋白,牛RBP4蛋白的氨基酸序列 具体步骤:
首先在UNIPROT数据库中下载人RBP4蛋白(P02753),小鼠RBP4蛋 白(Q00724),鸡RBP4蛋白(P41263),猪RBP4蛋白(P27485), 牛RBP4蛋白(P18902)的氨基酸序列
Bioinformatics
Liaoning University
序列分别为鸡、小鼠、 人、猪和牛的RBP4蛋白 使用了Clustal Omega 软件 通过多序列比对可以发 现RBP4蛋白中的大部分 氨基酸残基在多个哺乳 动物中都保守。
Bioinformatics
Liaoning University
例子4:使用ClstalX比对人RBP4蛋白,小鼠RBP4蛋白,鸡 RBP4蛋白,猪RBP4蛋白,牛RBP4蛋白的氨基酸序列 ClustalX是需要安装的软件,需要先下载, 安装之后才能使用。 具体步骤:
打开ClustalX后,点击File Load Sequences,加载包含上述蛋白 序列的FASTA文件
GXW 保守 模体
Bioinformatics
Liaoning University
多序列比对常用软件
Clustal Omega /Tools/msa/clustalo/
MUSCLE
/Tools/msa/muscle/ CLUSTAL X /clustal2/(下载网站) MEGA(分子发育分析综合软件,集成了ClustalW和MUSCLE)
然后打开Clustal Omega的在线服务器网址 把所有蛋白序列粘贴到文本框中,也可以直接上传FASTA文件 然后提交
Bioinformatics
Liaoning University
多序列比对结果 ALN格式,参照 第三节课PPT中 介绍
Bioinformatics
Liaoning University
然后点击W按钮或通过菜单栏Alignment >> Alignment by ClustalW
出现参数页面,可以调整参数,一般都使用默认参数,点击OK进行序 列比对
Bioinformatics
Liaoning University
Bioinformatics
Liaoning University
然后点击Alignment >> Do complete alignment,选择好比对结果 文件的文件夹,进行序列比对
Bioinformatics
Liaoning University
Bioinformatics
Liaoning University
例子5:使用MEGA中的ClustalW比对人RBP4蛋白,小鼠RBP4 蛋白,鸡RBP4蛋白,猪RBP4蛋白,牛RBP4蛋白的氨基酸序 列 MEGA也需要安装之后才能使用。 具体步骤:
动态规划算法:
全局序列比对:Needleman-Wunsch算法 /Tools/psa/emboss_needle/ 局部序列比对:Smith-Waterman算法 /Tools/psa/emboss_water/
Bioinformatics


Bioinformatics
Liaoning University
序列比对结果的表示方法
匹配:竖线(|)
相似:双点(:) 较弱的相似:单点(.)
空位:短横线(-)
不相似的替换:空白
Bioinformatics
Liaoning University
• 两序列进行比对,通常使一个得分矩阵(scoring matix)来计算比对的分值,以得到一个评价优劣的 标准。 • 核酸的得分矩阵:等价矩阵、BLAST矩阵……
多序列比对
• • • 多序列比对,实际上是一组蛋白质之间的一系列的双 序列比对。 与双序列比对相比,多序列比对更能发现进化保守关 系信息。 在双序列比对中出现的相同的氨基酸残基,虽然在两 条序列上是保守的,但这种保守可能只是偶然的。

而如果某一位点在多序列比对的都出现了相同的氨基 酸残基,则说明该残基是进化保守的可能性更大。
然后提交
Bioinformatics
Liaoning University
人RBP4蛋白和人 lipocalin1蛋白局 部比对结果
比对不是从第一个氨基酸 开始的,也不是到最后一 个氨基酸结束,而是找出 了相似性最高的一部分 (局部比对)
全局比对结果
Bioinformatics
Liaoning University
Hale Waihona Puke 序列比对结果Bioinformatics
Liaoning University
例子2:使用Smith-Waterman算法对人RBP4蛋白和人 lipocalin1蛋白进行局部比对 局部比对:寻找序列中相似度最高的区域,也就是匹 配密度最高的部分。局部比对适用于某些部位相似度 较高,而其他部位差异较大的序列。 具体步骤:
Liaoning University
生物信息学
Life Science School Hongsheng Liu Prof.
Bioinformatics
Liaoning University
第三章:序列比对
Bioinformatics
Liaoning University
序列比对的基本概念 打分矩阵 序列比对算法 序列比对软件使用方法介绍
如果需要可以调整比对的参数,如:得分矩阵,空位罚分等
然后提交
Bioinformatics
Liaoning University
粘贴序列
粘贴序列
修改参数
提交 Bioinformatics
Liaoning University
人RBP4蛋白和小鼠 RBP4全局序列比对 结果
一致性 相似性 空位 得分
Bioinformatics
首先在UNIPROT数据库中下载人RBP4蛋白(P02753)和人 lipocalin1蛋白(P31025)的氨基酸序列 然后打开Smith-Waterman算法程序(Water)的在线服务器网址 把人RBP4序列和人lipocalin1蛋白序列分别粘贴到两个文本框中
如果需要可以调整比对的参数,如:得分矩阵,空位罚分等
Bioinformatics
Liaoning University
Clustal W
Bioinformatics
Liaoning University
ClustalW的参数设置页面,一般 情况下使用默认参数
Bioinformatics
Liaoning University
Bioinformatics
序列分别为人的载脂蛋 白D,人视黄醇结合蛋白 4,孕激素相关子宫内膜 蛋白,补体8(γ肽), lipocalin1,人气味结合 蛋白2A, α-1微球蛋白, 嗜中性明胶酶相关蛋白, 前列腺素D2合成酶 通过多序列比对可以发 现人这些旁系同源物序 列高度趋异,互相之间 的相似度并不高。 但都存在一个保守的模 体:GXW,即甘氨酸-任 意氨基酸-色氨酸。
Liaoning University
例子1:使用Needleman-Wunsch算法对人RBP4蛋白和小鼠 RBP4蛋白进行全局比对 全局比对:对序列从头到尾进行比较。试图使尽可能 多的字符在同一序列中匹配。全局比对适用于相似度 较高而长度相近的序列。 具体步骤:
首先在UNIPROT数据库( /)中下载人 RBP4蛋白(P02753)和小鼠RBP4蛋白(Q00724)的氨基酸序列 然后打开Needleman-Wunsch算法程序(Needle)的在线服务器网址 把人RBP4序列和小鼠RBP4序列分别粘贴到两个文本框中
Bioinformatics
Liaoning University
序列比对软件使用方法介绍
Bioinformatics
Liaoning University
内容回顾
• • 一致性:一致性指两个序列相同的程度。 保守性:某一氨基酸残基或序列的改变(突变)保持 了原始氨基酸残基的物理化学特征,那么这个突变就 是保守的。 相似性:相似性表示序列之间相关联的程度。与一致 性比较相似性进一步考虑了发生保守突变的氨基酸的 数目,即考虑了相似氨基酸的数目。 同源性:如果两个序列是来源于一个共同的祖先,那 么他们是同源的。
打开MEGA后,点击Align >> Edit/Built Alignment >> Create New Alignment >> Protein,出现序列编辑的界面 可以将蛋白质序列粘贴进去,也可以通过菜单栏Data >> Open >> Retrieve Sequences from File,加载包含上述蛋白序列的FASTA文 件
相关主题