当前位置:
文档之家› 生物信息学2016-9-序列比对
生物信息学2016-9-序列比对
Liaoning University
课堂练习题
1. 练习课件中的例子1-5 2. 使用ClastalX和MEGA比对载脂蛋白D(P05090),人视黄醇结合蛋 白4(P02753),孕激素相关子宫内膜蛋白(P09466),补体8 (γ肽)(P07360),lipocalin1(P31025),人气味结合蛋白 2A(Q9NY56), α-1微球蛋白(P02760),嗜中性明胶酶相关蛋 白(P80188),前列腺素D2合成酶(P41222)。并找到序列中的 保守氨基酸。括号中为蛋白的UNIPROT ID,根据此ID可在UNIPROT 网站中下载蛋白质序列。 3. 使用ClastalX和MEGA比对自己下载到的细菌ITS序列。注意在MEGA 中选择序列类型为DNA序列。
/ (下载网站)
Bioinformatics
Liaoning University
例子3:使用Clustal Omega比对人RBP4蛋白,小鼠RBP4蛋 白,鸡RBP4蛋白,猪RBP4蛋白,牛RBP4蛋白的氨基酸序列 具体步骤:
首先在UNIPROT数据库中下载人RBP4蛋白(P02753),小鼠RBP4蛋 白(Q00724),鸡RBP4蛋白(P41263),猪RBP4蛋白(P27485), 牛RBP4蛋白(P18902)的氨基酸序列
Bioinformatics
Liaoning University
序列分别为鸡、小鼠、 人、猪和牛的RBP4蛋白 使用了Clustal Omega 软件 通过多序列比对可以发 现RBP4蛋白中的大部分 氨基酸残基在多个哺乳 动物中都保守。
Bioinformatics
Liaoning University
例子4:使用ClstalX比对人RBP4蛋白,小鼠RBP4蛋白,鸡 RBP4蛋白,猪RBP4蛋白,牛RBP4蛋白的氨基酸序列 ClustalX是需要安装的软件,需要先下载, 安装之后才能使用。 具体步骤:
打开ClustalX后,点击File Load Sequences,加载包含上述蛋白 序列的FASTA文件
GXW 保守 模体
Bioinformatics
Liaoning University
多序列比对常用软件
Clustal Omega /Tools/msa/clustalo/
MUSCLE
/Tools/msa/muscle/ CLUSTAL X /clustal2/(下载网站) MEGA(分子发育分析综合软件,集成了ClustalW和MUSCLE)
然后打开Clustal Omega的在线服务器网址 把所有蛋白序列粘贴到文本框中,也可以直接上传FASTA文件 然后提交
Bioinformatics
Liaoning University
多序列比对结果 ALN格式,参照 第三节课PPT中 介绍
Bioinformatics
Liaoning University
然后点击W按钮或通过菜单栏Alignment >> Alignment by ClustalW
出现参数页面,可以调整参数,一般都使用默认参数,点击OK进行序 列比对
Bioinformatics
Liaoning University
Bioinformatics
Liaoning University
然后点击Alignment >> Do complete alignment,选择好比对结果 文件的文件夹,进行序列比对
Bioinformatics
Liaoning University
Bioinformatics
Liaoning University
例子5:使用MEGA中的ClustalW比对人RBP4蛋白,小鼠RBP4 蛋白,鸡RBP4蛋白,猪RBP4蛋白,牛RBP4蛋白的氨基酸序 列 MEGA也需要安装之后才能使用。 具体步骤:
动态规划算法:
全局序列比对:Needleman-Wunsch算法 /Tools/psa/emboss_needle/ 局部序列比对:Smith-Waterman算法 /Tools/psa/emboss_water/
Bioinformatics
•
•
Bioinformatics
Liaoning University
序列比对结果的表示方法
匹配:竖线(|)
相似:双点(:) 较弱的相似:单点(.)
空位:短横线(-)
不相似的替换:空白
Bioinformatics
Liaoning University
• 两序列进行比对,通常使一个得分矩阵(scoring matix)来计算比对的分值,以得到一个评价优劣的 标准。 • 核酸的得分矩阵:等价矩阵、BLAST矩阵……
多序列比对
• • • 多序列比对,实际上是一组蛋白质之间的一系列的双 序列比对。 与双序列比对相比,多序列比对更能发现进化保守关 系信息。 在双序列比对中出现的相同的氨基酸残基,虽然在两 条序列上是保守的,但这种保守可能只是偶然的。
•
而如果某一位点在多序列比对的都出现了相同的氨基 酸残基,则说明该残基是进化保守的可能性更大。
然后提交
Bioinformatics
Liaoning University
人RBP4蛋白和人 lipocalin1蛋白局 部比对结果
比对不是从第一个氨基酸 开始的,也不是到最后一 个氨基酸结束,而是找出 了相似性最高的一部分 (局部比对)
全局比对结果
Bioinformatics
Liaoning University
Hale Waihona Puke 序列比对结果Bioinformatics
Liaoning University
例子2:使用Smith-Waterman算法对人RBP4蛋白和人 lipocalin1蛋白进行局部比对 局部比对:寻找序列中相似度最高的区域,也就是匹 配密度最高的部分。局部比对适用于某些部位相似度 较高,而其他部位差异较大的序列。 具体步骤:
Liaoning University
生物信息学
Life Science School Hongsheng Liu Prof.
Bioinformatics
Liaoning University
第三章:序列比对
Bioinformatics
Liaoning University
序列比对的基本概念 打分矩阵 序列比对算法 序列比对软件使用方法介绍
如果需要可以调整比对的参数,如:得分矩阵,空位罚分等
然后提交
Bioinformatics
Liaoning University
粘贴序列
粘贴序列
修改参数
提交 Bioinformatics
Liaoning University
人RBP4蛋白和小鼠 RBP4全局序列比对 结果
一致性 相似性 空位 得分
Bioinformatics
首先在UNIPROT数据库中下载人RBP4蛋白(P02753)和人 lipocalin1蛋白(P31025)的氨基酸序列 然后打开Smith-Waterman算法程序(Water)的在线服务器网址 把人RBP4序列和人lipocalin1蛋白序列分别粘贴到两个文本框中
如果需要可以调整比对的参数,如:得分矩阵,空位罚分等
Bioinformatics
Liaoning University
Clustal W
Bioinformatics
Liaoning University
ClustalW的参数设置页面,一般 情况下使用默认参数
Bioinformatics
Liaoning University
Bioinformatics
序列分别为人的载脂蛋 白D,人视黄醇结合蛋白 4,孕激素相关子宫内膜 蛋白,补体8(γ肽), lipocalin1,人气味结合 蛋白2A, α-1微球蛋白, 嗜中性明胶酶相关蛋白, 前列腺素D2合成酶 通过多序列比对可以发 现人这些旁系同源物序 列高度趋异,互相之间 的相似度并不高。 但都存在一个保守的模 体:GXW,即甘氨酸-任 意氨基酸-色氨酸。
Liaoning University
例子1:使用Needleman-Wunsch算法对人RBP4蛋白和小鼠 RBP4蛋白进行全局比对 全局比对:对序列从头到尾进行比较。试图使尽可能 多的字符在同一序列中匹配。全局比对适用于相似度 较高而长度相近的序列。 具体步骤:
首先在UNIPROT数据库( /)中下载人 RBP4蛋白(P02753)和小鼠RBP4蛋白(Q00724)的氨基酸序列 然后打开Needleman-Wunsch算法程序(Needle)的在线服务器网址 把人RBP4序列和小鼠RBP4序列分别粘贴到两个文本框中
Bioinformatics
Liaoning University
序列比对软件使用方法介绍
Bioinformatics
Liaoning University
内容回顾
• • 一致性:一致性指两个序列相同的程度。 保守性:某一氨基酸残基或序列的改变(突变)保持 了原始氨基酸残基的物理化学特征,那么这个突变就 是保守的。 相似性:相似性表示序列之间相关联的程度。与一致 性比较相似性进一步考虑了发生保守突变的氨基酸的 数目,即考虑了相似氨基酸的数目。 同源性:如果两个序列是来源于一个共同的祖先,那 么他们是同源的。
打开MEGA后,点击Align >> Edit/Built Alignment >> Create New Alignment >> Protein,出现序列编辑的界面 可以将蛋白质序列粘贴进去,也可以通过菜单栏Data >> Open >> Retrieve Sequences from File,加载包含上述蛋白序列的FASTA文 件