当前位置:文档之家› 基因组数据库

基因组数据库


• 国际上权威的核酸序列数据库
(1)欧洲分子生物学实验室的EMBL http://www.embl-heidelberg.de (2)美国生物技术信息中心的GenBank /Web/Genbank /index.html (3)日本遗传研究所的DDBJ http://www.ddbj.nig.ac.jp/
为创建和更新日期行
“DE”为序列描述行; “KW”为关键字行; “OG”行描述细胞组织; “OS”行描述生物体种属; “OC”行描述生物体分类信息; “RN”描述参考文献的编号; “RP”描述参考文献的页码; “RA”描述参考文献的作者; “RT”描述参考文献的题目; “RL”描述参考文献的出处; “RC”描述参考文献的注解; “RX”、“DR”行描述交叉引用信息; “FH” 为特征开始符号; “FT”为特征表行 (1)Feature Key,它是描述域生物功能的关键字; (2)Location,指明特征在序列中的特定位置; (3)Qualifiers,描述关于一个特征的辅助信息;
基因组数据库
• 随着核酸测序技术的迅速发展,人类已经得到一 部分生物的全基因组数据,如人、小鼠、大鼠等。 这些数据对于我们认识基因组信息组织的奥秘、 了解生物体的生长发育的规律是非常重要的。 • 国际上有专门的组织收集和管理这些数据。NCBI 基因组数据库Entrez Gonomes (/entrez/query.fcgi? db=Genome)所收集的基因组数据量非常大,
基因组数据库(GDB)
• GDB 人类基因组学数据库
• 资源名称:The Genome Database
• 交替名称:基因组数据库
• 创建机构:美国马里兰州巴尔的摩市约 翰· 霍普金斯大学

基因组数据库(GDB)为人类基因组计划 (HGP)保存和处理基因组图谱数据。 • GDB的目标是构建关于人类基因组的百科 全书,除了构建基因组图谱之外,还开发 了描述序列水平的基因组内容的方法,包 括序列变异和其它对功能和表型的描述。 • 。
1文摘型数据库 2全文型数据库
3事实型数据库
4生物医学专业网站 5生物医学整合知识平台
文摘型生物医学数据库
1.Pubmed数据库 2.TOXNET数据库 3.EMBase荷兰医学文摘

• 如是对引起胃癌基因感兴趣的读者,想从 事这方面的研究,请问如何查找这方面的 信息。能够对这方面的研究动态有一定的 了解
EMBL核酸数据库中的每一个序列数据被赋予一个登录号, 它是一个永久性的唯一标识 EMBL的序列数据用外在的ASCII文本文件来表示, 而每一个文件分为文件头和文件体两大部分
文件头由一系列的信息描述行所组成,
文件头实际上对应于一个序列的注释(annotation)
“ID”为序列的标识符行,包括登录号、类型,分子的长度 “AC”为登录号行; “XX”为分隔符号行; “DT”
生物分子数据库
生物分子数据库应满足5个方面的主要需求
(1)时间性 (2)注释 (3)支撑数据 (4)数据质量
(5)集成性
生物分子数据库
一级数据库
数据库中的数据直接来源于实验获得的原始数 据,只经过简单的归类整理和注释
二级数据库
对原始生物分子数据进行整理、分类的结果, 是在一级数据库、实验数据和理论分析的基础 上针对特定的应用目标而建立的 。
生物大分子结构数据库
1、PDB(Protein Data Bank)
• PDB中含有通过实验(X射线晶体衍射,核 磁共振NMR)测定的生物大分子的三维结 构
– 蛋白质 – 核酸 – 糖类 – 其它复合物
其它生物分子数据库
1、单碱基多态性数据库dbSNP
• 核酸序列变化 – 单碱基多态性SNPs(Single nucleotide polymorphisms) • SNPs对人类遗传学研究和医学应用具有重要的意义 – 无论对于人类种群遗传学的研究,还是对疾病性状分析 或个体化医疗,都需要深入地研究SNPs。
1. 2. 3. 4. 5. 6.
网络生物医学资源概论 生物分子数据库 基因组数据库 蛋白质序列、生物大分子结构数据库 蛋白质二级结构、互作数据库 基因产物注释数据库
网络生物医学资源概论
• 网络生物医学资源所包含的主要内容 网上生物医学文献数据库
网上生物医学数据库(分子生物学数据库)
网上生物医学文献类型
文件体由序列本身所组成,由“SQ”标志的行开始。
序列结束的标记是“//”。
核酸数据库提供一些与序列相关的检索操作 (基于3W服务器)
(1)序列查询
最简单的查询就是通过序列的登录号(如X58929) 或序列名称(如SCARGC)直接查询。
如果找到所查询的序列,则服务器将查询结果以HTML文件返回 给用户 如果数据库中该序列有到MEDLINE的交叉索引,则系统同时返回 与包含参考文献摘要等信息的MEDLINE链接 如果该序列有到其它数据库的交源性搜索
3W服务器支持用户使用FastA程序进行核酸同源搜索。 FastA根据给定的目标序列在数据库中搜索其同源序列。
生物基因组数据库
• 基因组数据库(GDB) • 鼠基因组数据库 MGD • (/)
• 酵母基因组数据库 SGD • (/Saccharomyces/)
蛋白质序列数据库
• • • • 1、PIR(Protein Information Resource) 2、SWISS-PROT 3、TrEMBL 4、蛋白质数据仓库UniProt
UniProt包含3个部分:
(1)UniProt Knowledgebase(UniProt) 蛋白质序列、功能、分类、交叉引用等信息存取 中心 (2)UniProt Non-redundant Reference(UniRef) 数据库 将密切相关的蛋白质序列组合到一条记录中 以便提高搜索速度; (3)UniProt Archive(UniParc) 资源库,记录所有蛋白质序列的历史。
相关主题