当前位置:文档之家› 其他基因组数据库

其他基因组数据库


(1)Quick Search(快速查询)
(2)Standard Query(标准查询)
(3)Extended Query(扩展查询)
标准查询后的结果
CS116935的详细信息
三、DDBJ
(一)DDBJ 概述
(二)DDBJ 检索
29
(一)DDBJ概述
DDBJ (DNA Data Bank of Japan,日本核酸数据 库,http://www.ddbj.nig.ac.jp/indexe.html)创建于1986,现由日本国家遗传学研究所的生 物信息中心(CIB/DDBJ)管理和维护。 截止至2009年9月,DDBJ(79版)共收录 108,593,519条序列, 106,684,379,504个碱基。 DDBJ 主页除了提供SRS、ARSA、TXSearch 、 BLAST等数据检索功能外,还提供SAKURA、MSS、 Sequin数据提交工具和CLUSTAL W、FASTA、 BLAST等数据分析工具。
SRS查询方法 通过EBI的SRS服务器 ()进入Quick Search界面。 点击“Library Page”,即数据库选择页。 选择好要检索的数据库后,SRS提供三种查询 方式。 (1)Quick Search (快速查询) (2)Standard Query(标准查询) (3)Extended Query(扩展查询)
(二)EMBL-Bank检索 获取EMBL-Bank的核酸序列数据主要是通过 SRS(Sequence Retrieval System)序列 检索系统 由Lion Bioscience公司继续开发,而成为一 个商业软件,科研单位只要与它签订协议即可获 得该软件的免费使用权。 SRS是一个开放式的,可以根据需要安装不同的 数据库。
二、 EMBL-Bank
(一)EMBLBank概述
(二)EMBLBank检索
20
(一)EMBL-Bank概述 EMBLBank(/embl/)是 国际三大核酸序列数据库之一,创建于1982年。 现由欧洲生物信息学研究所(EBI)管理和维护, 主要收集欧洲产生的核酸序列数据。 到2009年8月,EMBL-Bank(101版)的核 酸序列达到163656234条,碱基数达到 283748816763个。 对于每条核酸序列,相关信息包括序列名称、序 列、染色体定位、关键字、来源生物体、参考文 献、注释、序列中具有重要生物学意义的位点等。
第八章 生物信息学资源检索
胡德华
目录
1
2 3
第一节 生物信息学数据库概述
第二节 核酸序列数据库
第三节 蛋白质数据库
4
5
第四节 基因组数据库
第五节 疾病基因数据库
2
第一节 生物信息学数据库概述
一 生物信息学数据库的类型

生物信息数据收集与存贮

生物信息学数据库的查找
3
一、生物信息学数据库的类型
按收录信息内容分
6
(二)生物信息数据的存贮
存贮格式
1.记录格式 主要有: EMBL格式、 GenBank格式
2.序列格式 又称Pearson 格式
7
三、生物信息学数据库的查找 (一)通过搜索引擎查找 (二)通过专门的生物信息学数据库目录查询
从2000年开始,《Nucleic Acids Research 》设立了 一个数据库目录 (/nar/database/c/)。
国际核酸序列数据库协作体
DDBJ
INSDC EMBL
GenBank
12
(一)GenBank概述
GenBank的数据来源于约260000个物种,每月新增 1700多个物种。大约12%的序列来自于人类,其中 8%是人类的EST序列。 每条GenBank数据记录包含对序列的简要描述、它的科 学命名、物种分类名称、参考文献、序列特征表以及序列 本身。 序列特征表里包含对序列生物学特征注释,如编码区、转 录单元、重复区域、突变位点或修饰位点等。 所有数据记录被划分成若干个子库,如细菌类(BCT)、 病毒类(VRL)、灵长类(PRI)、啮齿类(ROD)以 及EST数据、基因组序列数据(GSS)、高通量基因组 序列数据(HTG)等19类,其中EST数据等又被分成若 干子库。
突变数据库 图谱数据库
文献数据库
类型
结构数据库
序列数据库
4
二、生物信息数据收集与存贮
生物信息数据 收集与存贮
(一)生物信 息数据的收集
(二)生物信 息数据的存贮
5
(一)生物信息数据的收集
数据库与数据库合作
4.数据交换
数据库与测序中心合作
3.成批发送
数据库与期刊合作
2.直接发送
建库的初期
1.人工收集
(2)点击“GO”,得到各个数据库的检索结果。
(3)点击“Nucleotide: Core subset of nucleotide sequence records”,得到 GenBank核酸序列数据库中的4801条记录简要格式(Summary)。
(4)点击记录的标题,即可获取该记录的详细信息。
(三)通过生物信息学中心资源导航查询
一些著名的生物信息学中心不仅自己建立和维护大量 的生物信息数据库,而且一般在网上提供资源导航。
第二节 核酸序列数据库

GenBank

EMBL-Bank

DDBJ
9
一、GenBank
(一) GenBank概述
(二) GenBank检索源自10(一)GenBank概述 是由美国国家生物技术信息中心(NCBI)管 理和维护大型、综合性的公共核酸序列数据 库,包括所有已知的核酸序列和蛋白质序列, 以及与它们相关的文献和生物学注释。 网址: /Gen bank/index.html
(二)GenBank检索 Entrez是NCBI生物信息学数据库集成检索系统, 可以检索以下生物信息学数据库。
例如,查找H1N1流感病毒(H1N1 Flu Virus) 的核酸序列。其检索步骤是:
(1)进入Entrez主页(/gquery/), 在提问框输入H1N1 Flu Virus。
相关主题