当前位置:
文档之家› Blast使用技巧PPT课件
Blast使用技巧PPT课件
可以修改显示结果格式
16
结果页面(一)
图形示意结果
17
结果页面(二)
目标序列描述部分
带有genbank的链接,点击可以进入 相应的genbank序列
匹配情况,分值,e值
18
结果页面(三)
详细的比对上的序列的排列情况
查询序列和目标序列之间的字母表示两个氨基Байду номын сангаас相同,加号+表示两个氨基酸相似。 空白表示既不相同也不相似。
7
程序名 Blastn Blastp
查询序列 核酸 蛋白质
Blastx
核酸
Tblastn 蛋白质
TBlastx
核酸
数据库
搜索方法
核酸 核酸序列搜索逐一核酸数据库中的序列
蛋白质 蛋白质 核酸 核酸
蛋白质序列搜索逐一蛋白质数据库中的序 列
核酸序列翻译成蛋白质序列后和蛋白质数 据库中的序列逐一搜索。
蛋白质序列和核酸数据库中的核酸序列翻 译后的蛋白质序列逐一比对。
19
一个具体的例子(blastp)
假设以下为一未知蛋白序列
>query_seq
MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFT ALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWY FYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQG TTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALAL LLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFG RRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTW LTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQ KKQPTVTLLPAADMDDFSRQLQNSMSGASADST QA
36
DNA
tblastx将查询DNA以及数据库中的DNA都翻译成6种可能的蛋白质, 然后进行36次蛋白质-蛋白质数据库搜索
9
10
Blast程序评价序列相似性的两个数据
Score:使用打分矩阵对匹配的片段进行打分,这是
对各对氨基酸残基(或碱基)打分求和的结果,一般来 说,匹配片段越长、 相似性越高则Score值越大。
核酸序列翻译成蛋白质序列,再和核酸数 据库中的核酸序列翻译成的蛋白质序 列逐一进行比对。
8
Program Input
blastn
DNA
1
Database
DNA
blastn将一个DNA查询序列的两条链与一个DNA数据库进行比较
blastp
protein
1
protein
blastp将一个蛋白质查询序列与一个蛋白质数据库进行比较
生物序列的相似性搜索
-blast简介及其应用
生物序列的相似性
相似性(similarity): 是指一种很直接的数量关系,比如部
分相同或相似的百分比或其它一些合适 的度量。比如说,A序列和B序列的相似 性是80%,或者4/5。这是个量化的关 系。当然可进行自身局部比较。
2
生物序列的同源性
同源性(homology): 指从一些数据中推断出的两个基因或蛋
组中的重复序列等
E值上限
窗口大小 如果你对blast的命令行选项熟悉的话,可以在这里加入更多的参数
14
Blast任务提交表单(三)
E值范围
3.设置结果输出显示格式
选择需要显示的选项 以及显示的文件格式
显示数目
Alignment的显
筛选结果
示方式
点击开始搜索
其他一些显示格式参数
15
提交任务
返回查询号(request id) 修改完显示格式后点 击进入结果界面
键作用的氨基酸残基。
5
Blast简介(一)
BLAST 是由美国国立生物技术信息 中心(NCBI) 开发的一个基于序列相似性的数据库搜 索程序。
BLAST是“局部相似性基本查询工 具”(Basic Local Alignment Search Tool)的 缩写。
6
Blast简介(二)
Blast 是一个序列相似性搜索的程序包, 其中包含了很多个独立的程序,这些程序 是根据查询的对象和数据库的不同来定义 的。比如说查询的序列为核酸,查询数据 库亦为核酸序列数据库,那么就应该选择 blastn程序。 下表列出了主要的blast程序。
正因为存在这样的关系,很多时候对序列的 相似性和同源性就没有做很明显的区分,造成经 常等价混用两个名词。所以有出现A序列和B序 列的同源性为80%一说。
4
数据库搜索目的
确定特定的蛋白质或核酸序列有哪些已 知的直系同源或旁系同源序列。
确定哪些蛋白质和基因在特定的物种中 出现。
确定一个DNA或蛋白质序列身份。 发现新基因。 寻找对于一个蛋白质的功能或结构起关
白质序列具而共同祖先的结论,属于质的 判断。就是说A和B的关系上,只有是同 源序列,或者非同源序列两种关系。而说 A和B的同源性为80%都是不科学的。
3
相似性和同源性关系
序列的相似性和序列的同源性有一定的关系,一 般来说序列间的相似性越高的话,它们是同源序 列的可能性就更高,所以经常可以通过序列的相 似性来推测序列是否同源。
6
blastx
DNA
protein
blastx将一个DNA序列用所有可能的阅读框翻译成6个蛋白质, 然后将它们逐一与一个蛋白质数据库进行比较
tblastn protein
6
DNA
tblastn将一个DNA数据库中的每一条序列翻译成6种可能的蛋白质,然后将 要查询的蛋白序列与翻译的蛋白质逐一进行比较
tblastx DNA
12
Blast任务提交表单(一)
序列范围 (默认全部)
1.序列信息部分
填入查询(query)的序列 选择搜索数据库 如果接受其他参数默认 设置,点击开始搜索
13
Blast任务提交表单(二)
2.设置各种参数部分
设置搜索的范围,entrez关键词, 或者选择特定物种
一些过滤选项,包括简 单重复序列,人类基因
E value:在相同长度的情况下,两个氨基酸残基(或
碱基)随机排列的序列进行打分,得到上述Score值的 概率的大小。E值越小表示随机情况下得到该Score值的 可能性越低。
11
NCBI提供的Blast服务
登陆ncbi的 blast主页
核酸序列
蛋白序列
翻译序列
底下有其他一些针对 特殊数据库的和查看 以往的比对结果等