当前位置:文档之家› NCBI使用方法

NCBI使用方法


NCBI的责任 1.使用数学和计算机方法在分子水平上开展基础生物 医学课题研究 2.保持与NIH (National Institutes of Health 国家卫生研究 所)内的其它机构以及学术界、工业领域、政府相关 部门的合作 3.通过会议、讨论组、系列讲座以促进科学交流 4.通过NIH内部的研究计划,开展计算生物学基础和 应用领域的博士后研究 5.通过科学访问学者计划,组织国际间的生物信息学 研究和学习。 6.加速生物技术研究者和医药治疗人员对数据库和 软件的使用。 7.数据库,数据记录与交换,生物命名的标准化 系统的建立
NCBI通过下面的计划来实现它的四项目的: 基本研究 NCBI有一个多学科的研究小组包括计算机科学家, 分子生物学家,数学家,生物化学家,实验物理学家和 结构生物学家,集中于计算分子生物学的基本的和应用 的研究。他们一起用数学和计算的方法研究在分子水平 上的基本的生物医学问题。这些问题包括基因的组织, 序列的分析和结构的预测。目前研究计划的一些代表是: 检测和分析基因组织,重复序列形式,蛋白domain和结构 单元,建立人类基因组的基因图谱,HIV感染的动力学数学 模型,数据库搜索中的序列错误影响的分析,开发新的数 据库搜索和多重序列对齐算法,建立非冗余序列数据库, 序列相似性的统计显著性评估的数学模型和文本检索的矢量 模型。另外,NCBI研究者还坚持推动与NIH内部其他研究 所及许多科学院和政府的研究实验室的合作。
NCBI的任务是发展新的信息学技术来帮助 理解那些控制健康和疾病的基本分子和遗 传过程。此外,NCBI还负责开发自动化系 统用于存储、分析关于分子生物学、生物 化学、遗传学等方面知识信息;通过研究和 医学团体所提供的软件和数据库使得其得以 利用;收集国内外生物技术信息资源;开展 基于计算机信息处理过程高级方法研究,用 于分析生物大分子的结构和功能。

GenBank数据库检索及其应用 GenBank数据库检索及其应用
GenBank数据库是由美国国立生物技术信息中心(NCBI) GenBank数据库是由美国国立生物技术信息中心(NCBI) 数据库是由美国国立生物技术信息中心 维护的一级核酸序列数据库。 维护的一级核酸序列数据库。
后来的参议员Claude Pepper意识到电脑化 过程方法对生物医学研究的重要性,在1988 年11月4日立法建立美国国立生物技术中心
数据库和软件 在1992年10月,NCBI承担起对GenBank DNA序列 数据库的责任。NCBI受过分子生物学高级训练的工作 人员通过来自各个实验室递交的序列和同国际核酸序列 数据库(EMBL和DDBJ)交换数据建立起数据库。同美国 专利和商标局的安排使得专利的序列信息也被整合。 GenBank是NIH遗传序列数据库,一个所有可以公开 获得的DNA序列的注释过的收集。GenBank同日本和欧 洲分子生物学实验室的DNA数据库共同构成了国际核酸序 列数据库合作。这三个组织每天交换数据。GenBank以指 数形式增长,核酸碱基数目大概每14个月就翻一个倍。 最近,GenBank拥有来自47,000个物种的30亿个碱基。
在重点开发GenBank的同时,又开发了Entrez 数据库 检索系统。该系统整合了GenBank、EMBL、PIR和SWISSPROT(经过注释的蛋白质序列数据库)等数据库的序列信息以及 MEDLINE有关序列的文献信息,并通过相关链接,将他们 有机地结合在一起。NCBI还提供了其它数据库,包括在线 人类孟德尔遗传(OMIM)、三维蛋白结构的分子模型数据 库(MMDB)、人类基因序列集成(UniGene)、人类基因组基 因图谱(GMHG)、生物门类(Toxonomy) 等数据库。
教育和训练 NCBI通过赞助会议,研讨会和系列演讲来培养 在应用于分子生物学和遗传学的计算机领域的 科学交流。一个科学访问学者项目已经成立, 来培养同外部科学家的合作。作为NIH内部的 部分研究项目,也提供博士后工作位置。
NCBI数据库介绍 Nucleotide 该数据库由国际核苷酸序列数据库成员美国国立卫生研 究院GenBank、日本DNA数据库(DDBJ)和英国Hinxton Hall 的欧洲分子生物学实验室数据库(EMBL)三部分数据组成。 这三个组织联合组成国际核苷酸序列数据库协作体,每天交 换各自数据库中的新增序列记录实现数据共享。其中的序列 数据也通过与基因组序列数据库(GSDB)合作获取;专利序列 数据通过与美国专利与商标局、国际专利局合作获取。
(National Center for Biotechnoቤተ መጻሕፍቲ ባይዱogy Information, 简称NCBI) 。
由于在创立和维护生物信息学数据库方面的 经验,NLM (The National Library of Medicine, 简称 NLM,该图书馆是美国国家卫生研究所的一部分)被选择 负责该中心,而且这可以建立一个内部的关于计 算分子生物学的研究计划。 因此,美国国家生物 技术中心隶属于美国国立医学图书馆之下。
NCBI位于马里兰州的贝塞斯达, 保管GenBank的基因测序 数据和Medline的生物医学研究论文索引. 所有的这些数据 库都可以通过Entrez搜索引擎在线访问. GenBank是一个有来自于70,000多种生物的核苷酸序列的 数据库。每条纪录都有编码区(CDS)特征的注释,还包 括氨基酸的翻译。GenBank属于一个序列数据库的国际合 作组织,包括EMBL和DDBJ。 Medline是NLM生产的国际性综合生物医学信息书目数 据库,是当前国际上最权威的生物医学文献数据库。 Entrez是一个用以整合NCBI数据库中信息的搜寻 和检索工具。这些数据库包括核酸序列,蛋白序 列,大分子结构,全基因组,和通过PubMed检 索的MEDLINE。
● ●
Genome 即基因组数据库,提供了多种基因组、完全染色体、 Contiged序列图谱以及一体化基因物理图谱。
Structures 即结构数据库或称分子模型数据库(MMDB), 包含来自X线晶体学和三维结构的实验数据。 ● Taxonomy 即生物学门类数据库,可以按生物学门类进行 检索或浏览其核苷酸序列、蛋白质序列、结构等。 ● PopSet 包含研究一个人群、一个种系发生或描述人群变化 的一组组联合序列。PopSet既包含核酸序列数据又包含 蛋白质序列数据。 ● OMIM 孟德尔遗传学(OMIM)数据库是人类基因和基因疾病的 目录数据库。该数据库包括原文信息、图片和参考信息, 同时还可以链接到Entrez系统MEDLINE数据库中相关文 献和序列信息。
相关主题