当前位置:文档之家› 生物信息学现状和重要研究方向 PPT课件

生物信息学现状和重要研究方向 PPT课件


美国的核酸数据库GenBank〖Banson,D.A. et al. (1998) Nucleic Acids Res. 26, 1-7〗从 1979年开始建设,1982年正式运行;欧洲 分子生物学实验室的EMBL数据库也于 1982年开始服务;日本于1984年开始建立 国家级的核酸数据库DDBJ,并于1987年正
/LocusLink/statistics.html);
分子生物学和遗传学的文献积累从60年代 中期的接近10万篇迅速增长至60年代末期 的20多万篇,即在3-4年间,翻了一番。此 后,至80年代中期,上升至约30万篇,即 平均每年增长6-7千篇。至90年代中,文献 数已上升至40多万篇;即在10年中,平均 每年增长1万篇。到2000年,则增长至约50 万篇,即在约5年间,又增长了10万篇(根 据有关 PubMed数据整理)。
生物信息学现状和重要研究方向
一. 什么是生物信息学?
Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition, processing, storage, distribution, analysis, and interpretation.
破译人类遗传密码就要读懂由30亿符号组成的100 万页的“天书”
计算机运算速度: 18个月增长一倍; DNA序列数据: 14个月增长一倍;
近年来GenBank中的DNA碱基数目呈指数增加,大约每14个月 增加一倍。到1999年12月其数目已达30亿,它们来自47000种生 物。2000年4月DNA碱基数目是60亿。现在,2001年初这一数目 已达110亿。各种生物的EST序列已达600多万条,其中人类的 EST序列已超过300 万条,估计覆盖人类基因90%以上; UniGene的数目约达7万个;自1999年初单核苷酸多态性 ( SNPs,Single Nucleotide Polymorphisms )数据库出现以来, 到2000年3月20日SNP的总数是26569,现在已超过350万;自全
它是一个学科领域,包含着基因组信息的获取、处理、存储、分 配 、分析和解释的所有方面。
(The U.S. Human Genome Project: The First Five Years FY 1991-1995, by NIH and DOE)
从美国的三个国家计划说起:曼哈顿计划;阿婆罗计 划;人类基因组计划。
1 page 3,000 characters
CCGGTCTCCCCGCCCGCGCGCGAAGTAAAGGCCCAGCGCAGCCCGCGCTCCTGCCCT GGGGCCTCGTCTTTCTCCAGGAAAACGTGGACCGCTCTCCGCCGACAGTCTCTTCCACA GACCCCTGTCGCCTTCGCCCCCCGGTCTCTTCCGGTTCTGTCTTTTCGCTGGCTCGATA CGAACAAGGAAGTCGCCCCCAGCGAGCCCCGGCTCCCCCAGGCAGAGGCGGCCCCGG GGGCGGAGTCAACGGCGGAGGCACGCCCTCTGTGAAAGGGCGGGGCATGCAAATTCG AAATGAAAGCCCGGGAACGCCGAAGAAGCACGGGTGTAAGATTTCCCTTTTCAAAGGCG GGAGAATAAGAAATCAGCCCGAGAGTGTAAGGGCGTCAATAGCGCTGTGGACGAGACA GAGGGAATGGGGCAAGGAGCGAGGCTGGGGCTCTCACCGCGACTTGAATGTGGATGAG AGTGGGACGGTGACGGCGGGCGCGAAGGCGAGCGCATCGCTTCTCGGCCTTTTGGCTA AGATCAAGTGTAGTATCTGTTCTTATCAGTTTAATATCTGATACGTCCTCTATCCGAGGAC AATATATTAAATGGATTGATCAATCCGCTTCAGCCTCCCGAGTAGCTGGGACTACAGACG GTGCCATCACGCCCAGCTCATTGTTGATTCCCGCCCCCTTGGTAGAGACGGGATTCCGC TATATTGCCTGGGCTGGTGTCGAACTCATAGAACAAAGGATCCTCCCTCCTGGGCCTGG GCGTGGGCTCGCAAAACGCTGGGATTCCCGGATTACAGGCGGGCGCACCACACCAGGA GCAAACACTTCCGGTTTTAAAAATTCAGTTTGTGATTGGCTGTCATTCAGTATTATGCTAA TTAAGCATGCCCGGTTTTAAACCTCTTAAAACAACTTTTAAAATTACCTTTCCACCTAAAAC GTTAAAATTTGTCAAGTGATAATATTCGACAAGCTGTTATTGCCAAACTATTTTCCTATTTG TTTCCTAATGGCATCGGAACTAGCGAAAGTTTCTCGCCATCAGTTAAAAGTTTGCGGCAG ATGTAGACCTAGCAGAGGTGTGCGAGGAGGCCGTTAAGACTATACTTTCAGGGATCATT TCTATAGTGTGTTACTAGAGAAGTTTCTCTGAACGTGTAGAGCACCGAAAACCACGAGGA AGAGAGGTAGCGTTTTCATCGGGTTACCTAAGTGCAGTGTCCCCCCTGGCGCGCAATTG GGAACCCCACACGCGGTGTAGAAATATATTTTAAGGGCGCG
式服务。从那个时候以来,DNA序列的数 据已经从80年代初期的百把条序列,几十 万碱基上升至现在的110亿碱基!这就是说, 在短短的约18年间,数据量增长了近十万 倍。
How many characters are in the “Heaven Book”?
3*109 10,000 books
1 book 100 pages
物基因Байду номын сангаас正在测试当中;
果蝇基因组包括1.2亿碱基对的编码区已于2000年2月 测序并组装完成;人类基因组研究的标志性工作,包 含三千三百万碱基对的人第22号染色体已于1999年11 月完成测序,其结果发表在1999年12月2日的Nature 杂志上。从第22号染色体已鉴定出679个基因,其中55 %的基因是未知的。有35种疾病与该染色体突变相关, 象免疫系统疾病、先天性心脏病和精神分裂症。作为 人类基因组研究的里程碑性的工作,覆盖率为90%的 人完整基因组的“工作草图”已经在2000年4月底完成, 到2003年将获得覆盖率为99%的人类基因组全部序列。 对人的大约3万个基因, 到目前为止已定位在染色体上 的基因数目有14015个(见
长1.8Mb的嗜血流感杆菌(Haemophilus influenzae Rd)基
因组序列于1995年发表(Fleischmann et al.,1995)以来, 已有54个模式生物的完整基因组被测序完成,它们中有9个古细 菌、31个原核真细菌、14个真核生物的完整基因组或它们的完 整染色体,其中包括酿酒酵母和线虫。还有另外的70余个微生
相关主题