序列相似性检索
2020/3/1
序列相似性检索
• Blast是为从相同和不同的有机体中,提供 对比核酸或蛋白质序列,寻找相似性序列片 断的工具。
• 通过寻找不同基因的相同序列片段,可以推 断最新测定的基因功能、预测基因家族的新 成员、探索基因的进化关系,预测蛋白质代 码和翻译产物的功能和定位。
2020/3/1
2020/3/1
点击“BLAST”后,进入该命令的主 界面,然后在“Nucleotide”栏中点 击“BLASTn”
进入nucleotide – nucleotide BLAST界面,将获得的DNA序列 粘贴到“Search”所对应的方框中, 随后根据需要在“Options”和 “Format”栏中对相关参数进行选择。 一般都可以不变。随后点击 “BLAST!”
基因组对比
基本对比 选择对比程序
特殊对比
2020/3/1
将序列数据 库中的复制 序列在此粘
贴
序列对比报告
对比资源 类似性图谱
2020/3/1
复旦大学图书馆文献检索教研室
数据库标识符 对比积分报告
基因定义
类似性积分
2020/3/1
复旦大学图书馆文献检索教研室
E值为匹配期 望值。说明可 以找到与搜索 序列相匹配的 其它序列的几 率。E值越接 近零,越不可 能找到其它的 匹配序列,其 背后的含义就 是E值越少, 匹配度越好
点击可得待检序列与库存 序列对排
单基因库
基因信息库
基因表达库链接
2020/3/1
复旦大学图书馆文献检索教研室
2020/3/1
人类染色体上的抗肿瘤基 因序列对排表
序列对排报告
对排序列 不一致处
2020/3/1
GenBank数据库中的两个序列比对实例
进入NCBI (/)
基于ClustalX的多重序列比对实例
ClustalX是Clustal多重序列比对程序的 Windows版本。它为进行多重序列比 对和分析结果提供一个整体的环境。
1.序列格式 序列利用菜单文件输入, 所有的序列必须放到一个文件中,文 件格式可以是*.txt格式,如现有6种序 列在一个文件中的输入格式上图 2.序列载入 打开软件界面中的文件 栏,点击“载入序列”,将文件载入 ClustalX中。 3.运行“完全比对”,得到的结果下图
序列比对的作用
1 分析功能 2 分析物种进化 3 检测突变、插入或缺失 4 序列延长 5 序列定位 6 预测基因功能
4
由核酸序列分析得到的信息
序列同源性分析
核酸序列
序列结构分析
聚类分析
染色体定位 同源核酸序列
外显子信息 启动子信息 转录子信息
重复序列分析
限制性酶切图谱
开放阅读框
进化关系
系统发育
5第三讲 序列的分析与来自似性搜索序列分析的意义
生物信息主要以基因的形式存在于DNA分子中,表现 为DNA分子上不同的核苷酸顺序。如果核苷酸的排列顺序发 生改变,那么它代表的生物学意义可能也会随之改变。因此, 测定DNA分子中的核苷酸排列顺序是生物学研究的基本内容 之一。核算序列分析方法,对于揭示基因组数据的生物学意 义、研究基因的结构和功能、揭示生命的奥秘具有十分重要 的意义
进入Format界面,点击“Format!”
得到比对的结果如左图
第四讲
多序列对位排列分析
主要应用于分析基因或蛋白质的进化
通过分析多个基因或蛋白质序列之间的同源性 确定它们在进化上的关系
分析基因家族中新成员的翻译起始位点和内含 子(预测的氨基酸序列的对位排列分析)
分析基因或蛋白质的功能
Internet 上的许多网站具有ClustalW分析软件
可以下载
对要分析的序列的输入格式有要求,FASTA (Pearson)格式
>sequence 1 A…TT…GCAGTTCGCA >sequence 2 A…TAGCACATCGCA…
分析方法(举例) 在Swiss Institute Bioinformatics(SIB)的EXPSY 分析主页(http://www.expasy.ch)的“Tools and software package” 栏目中点击“Alignment”
注:“*”代表各序列碱基完全匹配,“*” 越多表示序列同源性越高,“-”代表 空位
24
2008-3-17
19
1. 多序列对位排列分析 (multiple sequence alignment)
两条以上序列的对位排列分析
反转录转座子的反转录酶序列片段
核苷酸序列或氨基酸序列 可以发现保守的结构域(重要功能位点?) 多序列排列时允许插入空位
ClustalW:目前公认的的最好的进行 Multiple sequence alignment 的方法之一
在“Alignment” 网页的Sequence alignment- Multiple-CLUSTALW栏目中选择“My Hits”网 站
在ClustalW网页粘贴序列,点击“align”
多序列对位排列结果
点击“Optional output formats”中的“clustalw (aln)获得文本格式的排列结果
2008-3-17
2
序列相似性比较和序列同源性
分析
序列相似性比较:
就是将待研究序列与DNA或蛋白质序列库进行比较, 用于确定该序列的生物属性,也就是找出与此序列相似 的已知序列是什么。完成这一工作只需要使用两两序列 比较算法。常用的程序包有BLAST、FASTA等;
序列同源性分析:
是将待研究序列加入到一组与之同源,但来自不同 物种的序列中进行多序列同时比较,以确定该序列与其 它序列间的同源性大小。这是理论分析方法中最关键的 一步。完成这一工作必须使用多序列比较算法。常用的 程序包有CLUSTAL等;
序列比对的其他应用与实 际操作
1. DNA的碱基组成分析 2. 限制性核酸内切酶酶切位点分析 3. 核酸序列的检索与比较 4. 序列的数据库检索 5. 多重序列比
序列相似性检索
• Basic Local Alignment Search Tool
• 是核酸和蛋白质序列的局部对准相似 性检索工具。