当前位置:文档之家› Blast软件及常用数据库介绍

Blast软件及常用数据库介绍

2011-12-22 blast软件及常用数据库介绍 18
具体步骤 1.将所需比对的序列转化为fasta格式
2.执行比对命令
3.对比对结果分析
2011-12-22
blast软件及常用数据库介绍
19
比对结果
2011-12-22
blast软件及常用数据库介绍
20
2011-12-22
blast软件及常用数据库介绍
STEP2
用Blast程序包提供的 formatdb工具格式化序列 数据成数据库
2011-12-22
blast软件及常用数据库介绍
9
为什么要进行格式化?
因为构建的fasta格式的数据库文件必须被formatdb格式 formatdb.exe是所用的程序名 化后,才能被BLAST中的blastall、blastpgp、 -i (input file)参数用于指定需要格式化的数据库 MegaBLAST等程序使用。 month.nt是一个blast格式的数据库名
2011-12-22
blast软件及常用数据库介绍
24
图形结果
匹配序列列表
2011-12-22 blast软件及常用数据库介绍 25
输入的序列
Blast 结 果 的 详 细 比 对 结 果
在库里比对到的序列
2011-12-22
blast软件及常用数据库介绍
26
2011-12-22
blast软件及常用数据库介绍
3.对比对结果分析
2011-12-22
blast软件及常用数据库介绍
14
序列的fasta格式是最经常看到的格式之一。 Fasta格式开始于一个标识符:“>”,然后是一行描述,下面是 一行行的序列。每行最好不要超过80个字母。 新建一个名为 “text”的文本文档 打开,输入序列,如
>Text AGCTTTTCATTCTGACTGCAACGGGCAATATGTCTCTGTG TGGATTAAAAAAAGAGTGTCTGATAGCAGC TTCTGAACTGGTTACCTGCCGTGAGTAAATTAAAATTTTAT TGACTTAGGTCACTAAATACTTTAACCAA TATAGGCATAGCGCACAGACAGATAAAAATTACAGAGTAC ACAACATCCATGAAACGCATTAGCACCACC ATTACCACCACCATCACCATTACCACAGGTAACGGTGCG GGCTGACGCGTACAGGAAACACAGAAAAAAG CCCGCACCTGACAGTGCGGGCTTTTTTTTTCGACCAAAG GTAACGAGGTAACAACCATGCGAGTGTTGAA GTTCGGCGGTACATCAGTGGCAAATGCAGAACGTTTTCT GCGTGTTGCCGATATTCTGGAAAGCAATGCC AGGCAGGGGCAGGTGGCCACCGTCCTCTCTGCCCCCG CCAAAATCACCAACCACCTGGTGGCGATGATTG AAAAAACCATTAGCGGCCAGGATGCTTTACCCAATATCAG CGATGCCGAACGTATTTTTGCCGAACTTTT
3
BLAST资源
NCBI主站点: /BLAST/ ftp:///blast/ 其他站点: /blast/ /ncbi_blast.html /blast/ …… (网络版) (单机版)
2011-12-22
blast软件及常用数据库介绍
4
如何在windows操作系统下安装使用单 操作系统下安装使用单 如何在 机版BLAST软件? 软件? 机版 软件
下载BL-22
blast软件及常用数据库介绍
5
Blast程序的下载地址: ftp:///blast/executables/release/2.2. 9/blast-2.2.9-ia32-win32.exe
2011-12-22
blast软件及常用数据库介绍
2
BLAST的种类
Blast是一个集成的程序 是一个集成的程序 包,通过调用不同的比 对程序,blast实现了五 对程序, 实现了五 种可能的序列比对方式
白库做比对。 白库做比对。 Blastn:核酸序列对核酸库的比对,直接比较核酸序列的同源性。 核酸序列对核酸库的比对 直接比较核酸序列的同源性。 的比对, Tblastn:蛋白序列对核酸库的比对,将库中的核酸序列翻译成蛋白序列, 蛋白序列对核酸库的比对 将库中的核酸序列翻译成蛋白序列, 的比对, 比对蛋白序列的同源性。 比对蛋白序列的同源性。 Tblastx:核酸序列对核酸库在蛋白级别的比对,将库和待查序列都翻译成 核酸序列对核酸库在蛋白级别的比对 在蛋白级别的比对, 蛋白序列,然后对蛋白序。 蛋白序列,然后对蛋白序。
blast软件及常用数据库介绍
17
blast常用的一些参数
-p: 执行的程序名称 -d: 检索的数据库名称 -i : 要查询的序列文件名 -o :查询结果输出文件名 -m: 比对结果显示格式选项,缺省值为0 ,即pairwise格式。另 外还可以根据不同的需要选择1~6等不同的格式。 -I :在描述行中显示gi号[T/F],缺省值F -v :单行描述(one-line description)的最大数目,缺省值500 -b :显示的比对结果的最大数目,缺省值250 -a:运行BLAST程序所使用的处理器的数目,缺省值1 -T: 产生HTML格式的输出[T/F],缺省值F -n: 使用MegaBlast搜索[T/F],缺省值F -G: 打开一个gap的罚分(0表示使用缺省设置值),默认0 -E: 扩展一个gap的罚分(0表示使用缺省设置值),默认0 -q: 一个核酸碱基的错配(mismatch)的罚分(只对blastn有效), 缺省值-3 -r : 一个核酸碱基的正确匹配(match)的奖分(只对blastn有效), 缺省值1 -M: 所使用的打分矩阵,缺省值BLOSUM62
2011-12-22
blast软件及常用数据库介绍
10
原数据库文件
formatdb格式化数据库后,创建三个主要的文 库索引(indices),序列 序列(sequences)和 件——库索引 库索引 序列 头(headers)文件。生成的文件的扩展名分别 是:.pin、.psq、.phr(对蛋白质序列) 或.nin、.nsq、.nhr(对核酸序列)。
2011-12-22
blast软件及常用数据库介绍
11
Formatdb 命 令 的 参 数 说 明 表
一个单独的blast数据库最大只能为4G,如果格式的数据库大 于4G,在“-v ”参数未设置的情况下,farmatdb程序会自动对 数 据库分卷 ,每卷最大为4G。也可以使用“-v ”参数设置卷 的大小,比如下面命令将卷的大小设置为2G : formatdb –i month.nt –p F –v 2000000000
保存在程序 目录下
2011-12-22 blast软件及常用数据库介绍 15
具体步骤 1.将所需比对的序列转化为fasta格式
2.执行比对命令
3.对比对结果分析
2011-12-22
blast软件及常用数据库介绍
16
在DOS窗口中,执行 blastall –p blastn –d month.nt –i text.txt –o out.txt
blastall:通用检索命令 -p(program name):为需要使用的程序名 blastn:为核酸序列对比搜索程序 -d(database name):指定所使用的数据库 的名称 -i (input file):待搜索的序列文件 -o(output file):指定保存结果的文件
2011-12-22
-p (type of file)参数用于指定文件类型,T为蛋白 质,F为核酸,默认为T 格式化的步骤: -o (parse options)参数用于指定是否解析序列ID并 1.打开MS-DOS (开始→附件→命令提示符) 创建索引,T为创建,F为不创建,默认为F 2.进入数据库所在的硬盘 3.输入formatdb.exe -i month.nt -p F -o T 再回车
27
2011-12-22
blast软件及常用数据库介绍
28
GeneBank库包含了所有已知的核酸序列和蛋白质序列,以 库包含了所有已知的核酸序列和蛋白质序列,
及与它们相关的文献著作和生物学注释 ,它是由美国国立生物技 它是由美国国立生物技 术信息中心(NCBI)建立和维护的。它的数据直接来源于测序工 建立和维护的。 术信息中心 建立和维护的 作者提交的序列 。Genbank每天都会与欧洲分子生物学实验室 每天都会与欧洲分子生物学实验室 (EMBL)的数据库,和日本的 的数据库, 数据库(DDBJ)交换数据,使这 交换数据, 的数据库 和日本的DNA数据库 数据库 交换数据 三个数据库的数据同步。 的数据可以从NCBI的FTP服 三个数据库的数据同步。Genbank的数据可以从 的数据可以从 的 服 务器上免费下载完整的库,或下载积累的新数据。 务器上免费下载完整的库,或下载积累的新数据。NCBI还提供 还提供 广泛的数据查询、序列相似性搜索以及其它分析服务, 广泛的数据查询、序列相似性搜索以及其它分析服务,用户可以 从NCBI的主页上找到这些服务 。 的主页上找到这些服务
blast软件及常用数据库介绍
7
获 取 数
点击
据 库
nr.gz为非冗余数据库 nt.gz为核酸数据库
BLAST数据库
Month.nt.gz为最近一个月 的核酸数据库
右击需要下载的数据库,点击另
存为
2011-12-22
blast软件及常用数据库介绍
8
如何在windows操作系统下安装使用本 操作系统下安装使用本 如何在 软件? 地BLAST软件? 软件
相关主题