当前位置:
文档之家› 第二章 生物信息学数据库资源.ppt
第二章 生物信息学数据库资源.ppt
有6条染色体,全基因组于1998年测定,长9.7Mb
10
模式生物(Model Organism)
Drosophila melanogaster
果蝇
繁殖很快、容易诱发变异的小昆虫。 总长达1.8亿核苷酸。
11
模式生物(Model Organism)
Arabidopsis thaliana
拟南芥
个体生活周期只有6周的十字花科 小草,是一种理想的模式植物。
• 此后不久因一项美国国家健康研究中心与洛斯阿 拉莫斯国家实验室的合同而诞生了GenBank。
• 日本的DNA数据库(DDBJ),在几年后加入了数据 收集的合作。
23
基因组数据库的发展历史
• 1988年一次三方会议之后(现在称之为“国际DNA 序列数据库合作计划”)达成协议,对数据库的 记录采用共同的格式
TrEMBL等, • 蛋白结构数据库有PDB, MMDB等, • 与基因组有关的数据库还有dbEST, OMIM等,
20
3大核酸数据库
• 基因组数据库的相关背景 • 主要的基因组数据库资源 • 重点介绍GenBank
21
Primary vs. Derivative Databases
Curators
第二章 生物信息学数据库资源
1
提纲:
模式生物测序 3大核酸数据库 蛋白质数据库
2
提纲:
模式生物测序 3大核酸数据库 蛋白质数据库
3
一、模式生物
Ureaplasma urealyticum
Bacillus subtilis
Drosophila melanogaster
Rickettsia prowazekii
• 现在三个中心都收集直接提交的数据,并在三者 之间发布。
24
三大基因数据库
• Genbank Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与 它们相关的文献著作和生物学注释。它是由美国国立生物技术 信息中心(The National Center for Biotechnology Information, NCBI)建立和维护的。 NCBI的网址是:。
100nm
7
模式生物(Model Organism)
Escherichia coli 大肠杆菌
Escherichia coli K12
Escherichia coli O157:H7
大肠杆菌是研究得最为详尽的一个模式生物。这种 只有1.6微米长的、可以迅速繁殖的单细胞原核生物, 已经成为实验室和基因工程的重要工具。
Sequencing Centers
Labs
TATAGTACTCAGGCTACTGAGCTACTGAGCCG
RefSeq
TATAGCCG AGCTCCGATA CCGATGACAA
Genome Assembly
GenBank
UniGene
Algorithms
22
基因组数据库的发展历史
• DNA序列数据库最早于1982年在欧洲分子生物学实 验室诞生,随即就开始了一个数据库爆炸的时代。
完成,70余种正在进行。目前总量已达60亿碱基对!
5
Genome sizes in nucleotide pairs (base-pairs)
plasmids viruses bacteria fungi plants algae insects mollusks bony fish
amphibians reptiles birds
• EMBL(The European Molecular Biology Laboratory )核酸序 列数据库 由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询 检索可以通过通过因特网上的序列提取系统(SRS)服务完成。 数据库网址是:/embl/。
Helicobacter pylori
Buchnerasp. APS
Escherichia coli
human
Arabidopsis
Thermotoga maritima
Thermoplasma acidophilum
mouse
Caenorhabitis
rat
elegans
Borrelia burgorferi
mammals
104 105 106 107 108 109 1010 1011
6
模式生物(Model Organism) 病毒(Virus)
不具有细胞形态结构,仅由核酸和蛋白质构成; 如:人艾滋病毒HIV、SARS冠状病毒
体积小,10~300nm;
严格的专性细胞内寄生; 对抗生素不敏感。
电子显微镜下的SARS冠状病毒
8
模式生物(Model Organism) Saccharomyces cerevisiae
酿酒酵母
真菌界的单细胞真核生物,它的全基因组 已在1996年测定。
9
模式生物(Model Organism)
秀丽线虫Caenorhabditis elegans
一种透明的、生活在海滩泥沙中的小虫。
细胞数目一定:成虫细胞数目只有959个,其中包括302个神经元;
12
模式生物(Model Organism)
Oryza sativa
水稻
单子叶植物模式植物,390-430MB
13
模式生物(Model Organism)
非洲瓜蟾(Xenopus lavias)
1个受精卵在24小时内分裂到各种器官初具雏形的程度;
14
模式生物(Model Organism)
斑马鱼(Dቤተ መጻሕፍቲ ባይዱnio rerio)
身体透明的小鱼,生活周期约3个月,是研究脊椎动物发育 过程的良好对象。
15
模式生物(Model Organism) 小鼠(Mus musculus)
基因组大小与人类相近,约30亿个核苷酸对;
16
17
18
提纲:
模式生物测序 3大核酸数据库 蛋白质数据库
19
主要的数据库资源
• 核酸序列数据库主要有GenBank, EMBL, DDBJ等. • 蛋白质序列数据库主要有SWISS-PROT, PIR,
Plasmodium falciparum
Borrelia burgorferi
Aquifex aeolicus
Neisseria meningitidis Z2491
Mycobacteriu 4 m tuberculosis
模式生物基因组计划
模式生物基因组计划 酵母、线虫、果蝇、细菌、拟南芥等共约50多种已