当前位置:
文档之家› NCBIblast使用教程[1]
NCBIblast使用教程[1]
E值范围
3.设置结果输出显示格式
选择需要显示的选项 以及显示的文件格式
显示数目
Alignment的显
筛选结果
示方式
点击开始搜索
其他一些显示格式参数
NCBIblast使用教程[1]
提交任务
返回查询号(request id) 修改完显示格式后点 击进入结果界面
可以修改显示结果格式
NCBIblast使用教程[1]
NCBIblast使用教程[1]
Blast程序评价序列相似性的两个数据
Score:使用打分矩阵对匹配的片段进行打分,这是
对各对氨基酸残基(或碱基)打分求和的结果,一般来 说,匹配片段越长、 相似性越高则Score值越大。
E value:在相同长度的情况下,两个氨基酸残基(或
碱基)随机排列的序列进行打分,得到上述Score值的 概率的大小。E值越小表示随机情况下得到该Score值的 可能性越低。
分析过程(一)
1.登陆ncbi的blast主页
2.选择程序,因为 查询序列是蛋白序 列可以选择blastp,
点击进入
也可以选择tblastn
作为演示, 我们这里选blastp
NCBIblast使用教程[1]
分析过程(二)
3.填入序列(copy+pa索整个序列,不填
w 其他问题:实际使用时选择哪种方式(网 络,本地化),参数的选择,结果的解 释…
NCBIblast使用教程[1]
Blast资源
1.NCBI主站点:
/BLAST/(网络版) ftp:///blast/ (单机版)
5.选择搜索数据库,这里我们 选nr(非冗余的蛋白序列库)。
是否搜索保守区域数据库 (cdd),蛋白序列搜索才有。
NCBIblast我使用们教选程[上1]
分析过程(三)
6.限制条件,我们限制 在病毒里面找。
7.其他选项保持默认值
打分矩阵
NCBIblast使用教程[1]
分析过程(四)
8.输出格式选项保持 默认值
具体匹配情况
NCBIblast使用教程[1]
单机版的Blast使用(一)
为什么使用单机版的Blast? 1.特殊的数据库要求。 2.涉及序列的隐私与价值。 3.批量处理 4.其他原因??
NCBIblast使用教程[1]
单机版的Blast使用(二)
单机版Blast的基本操作过程 1.下载单机版的Blast程序
下载正确的Blast程序包
blast:在本地运行的blast程序包
wwwblast:在本地服务器建立blast服务
的网站
netblast:blast的客户端程序,直接链接
至NCBI的BLAST服务器,使用BLAST服 务,不需浏览器。
NCBIblast使用教程[1]
下载正确的Blast程序包
Blast程序包的名字上还包括了该程序包运行的硬
NCBIblast使用教程[1]
本地WEB版的Blast
在NCBI的FTP上,在blast程序的目录 下,还提供了一种供用户在自己的服务器 上建立Blast网页服务的软件包(wwwblast)。
使用该软件包,用户可以建立一个简 易的进行Blast运算的网站供实验室人员使 用。用于搜索的数据库同样可以灵活的定 义。
NCBIblast使用教程[1]
Blast简介(一)
BLAST 是由美国国立生物技术信息 中心(NCBI)
开发的一个基于序列相似性的数据库搜 索程序。
BLAST是“局部相似性基本查询工 具”(Basic Local Alignment Search Tool)的 缩写。
NCBIblast使用教程[1]
Blast任务提交表单(二)
2.设置各种参数部分
设置搜索的范围,entrez关键词, 或者选择特定物种
一些过滤选项,包括简 单重复序列,人类基因
组中的重复序列等
E值上限
窗口大小 如果你对blast的命令行选项熟悉的话,可以在N这CB里Ibla加st使入用更教程多[1的] 参数
Blast任务提交表单(三)
分相同或相似的百分比或其它一些合适 的度量。比如说,A序列和B序列的相似 性是80%,或者4/5。这是个量化的关 系。当然可进行自身局部比较。
NCBIblast使用教程[1]
生物序列的同源性
同源性(homology): 指从一些数据中推断出的两个基因或蛋
白质序列具而共同祖先的结论,属于质的 判断。就是说A和B的关系上,只有是同 源序列,或者非同源序列两种关系。而说 A和B的同源性为80%都是不科学的。
Blast简介(二)
Blast 是一个序列相似性搜索的程序包, 其中包含了很多个独立的程序,这些程序 是根据查询的对象和数据库的不同来定义 的。比如说查询的序列为核酸,查询数据 库亦为核酸序列数据库,那么就应该选择 blastn程序。 下表列出了主要的blast程序。
NCBIblast使用教程[1]
NCBIblast使用教程[1]
两种版本的Blast比较(一)
w 网络版本 包括NCBI在内的很多网站都提供了在线 的blast服务,这也是我们最经常用到的 blast服务。网络版本的blast服务就有方便, 容易操作,数据库同步更新等优点。但是 缺点是不利于操作大批量的数据,同时也 不能自己定义搜索的数据库。
结果页面(一)
图形示意结果
NCBIblast使用教程[1]
结果页面(二)
目标序列描述部分
带有genbank的链接,点击可以进入
匹配情况,分值,e值
相应的genbank序列
NCBIblast使用教程[1]
结果页面(三)
详细的比对上的序列的排列情况
NCBIblast使用教程[1]
一个具体的例子(blastp)
NCBI_blast_使用教程
2020/11/2
NCBIblast使用教程[1]
生物信息学常见的应用与软件
序列数据的保存格式与相关数据库资源 在数据库中进行序列相似性搜索 多序列比对 进化树构建与分子进化分析 Motif的寻找与序列的模式识别 RNA二级结构,蛋白质二、三级结构的预测 基因芯片的数据分析
NCBIblast使用教程[1]
NCBI提供的Blast服务
登陆ncbi的 blast主页
核酸序列
蛋白序列
翻译序列
底下有其他一些针对 特殊数据库的和查看 NCBIblas以t使往用教的程比[1对] 结果等
Blast任务提交表单(一)
序列范围 (默认全部)
1.序列信息部分
填入查询(query)的序列 选择搜索数据库 如果接受其他参数默认 设置,点击开始搜索 NCBIblast使用教程[1]
蛋白质序列和核酸数据库中的核酸序列6 框翻译后的蛋白质序列逐一比对。
核酸序列6框翻译成蛋白质序列,再和核 酸数据库中的核酸序列6框翻译成的蛋 白质序列逐一进行比对。
NCBIblast使用教程[1]
Blast相关的问题
w 怎么获得blast服务,怎么使用的问题?
w 为什么使用blast,可以获得什么样的信息?
NCBIblast使用教程[1]
内容提要
1.基本概念 相似性,同源性
2.Blast介绍 Blast资源和相关问题
3.Blast的应用 网络版,单机版
4.深入了解Blast(改进程序,算法基础) 5.其他的序列相似性搜索工具(fasta)
NCBIblast使用教程[1]
生物序列的相似性
相似性(similarity): 是指一种很直接的数量关系,比如部
ftp:///blast/executables/ 目录下,下载对应的操作系统版本。
2.解压程序包(blast-2.28-ia32-linux.tar.gz) 命令是: $ tar zxvf blast-2.28-ia32-linux.tar.gz
NCBIblast使用教程[1]
9.点击开始搜索
NCBIblast使用教程[1]
分析过程(五)
10.查询序列的一些 相关信息 在cdd库里面找到 两个保守区域, 点击可以进入
NCBIblast使用教程[1]
分析过程(六)
图形结果
NCBIblast使用教程[1]
分析过程(七)
匹配序列列表
NCBIblast使用教程[1]
分析过程(八)
件和操作系统环境:
操作系统
硬件环境(CPU)
linux
sparc
macox
powerPC
我们通过blast搜索来获取一些这个序列的 信息。
NCBIblast使用教程[1]
具体步骤
1.登陆blast主页 /BLAST/ 2.根据数据类型,选择合适的程序 3.填写表单信息 4.提交任务 5.查看和分析结果
NCBIblast使用教程[1]
2.其他站点:
/blast/ /ncbi_blast.html /blast/(果蝇)
…
NCBIblast使用教程[1]
Blast结果给出的信息
Blast结果会列出跟查询序列相似性比较 高,符合限定要求的序列结果,根据这些 结果可以获取以下一些信息。 1.查询序列可能具有某种功能 2.查询序列可能是来源于某个物种 3.查询序列可能是某种功能基因的同源基因 … 这些信息都可以应用到后续分析中。
假设以下为一未知蛋白序列
>query_seq
MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTAS WFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKEL SPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVL QLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMA SGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTAT KQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMS RIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKK KTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADST QA