当前位置:
文档之家› 生物信息学现状和重要研究方向
生物信息学现状和重要研究方向
生物信息学
美国的核酸数据库 GenBank 从 1979 年开始建设, 1982年正式运行; 欧洲分子生物学实验室的 EMBL数据库也于 1982 年开始服务; 日 本 于 1984 年 开 始 建 立 国 家 级 的 核 酸 数 据 库 DDBJ ,并于 1987 年正式服务。从那个时候以来, DNA序列的数据已经从80年代初期的百把条序列, 几十万碱基上升至现在的 110 亿碱基!这就是说, 在短短的约18年间,数据量增长了近十万倍。
生物信息学
How many characters are in the “Heaven Book”? 9 3*10 10,000 books
1 book 100 pages 1 page 3,000 characters
•
CCGGTCTCCCCGCCCGCGCGCGAAGTAAAGGCCCAGCGCAGCCCGCGCTCCTGCCCTGGGGCCTCGTCTTT CTCCAGGAAAACGTGGACCGCTCTCCGCCGACAGTCTCTTCCACAGACCCCTGTCGCCTTCGCCCCCCGGT CTCTTCCGGTTCTGTCTTTTCGCTGGCTCGATACGAACAAGGAAGTCGCCCCCAGCGAGCCCCGGCTCCCC CAGGCAGAGGCGGCCCCGGGGGCGGAGTCAACGGCGGAGGCACGCCCTCTGTGAAAGGGCGGGGCATGC AAATTCGAAATGAAAGCCCGGGAACGCCGAAGAAGCACGGGTGTAAGATTTCCCTTTTCAAAGGCGGGAG AATAAGAAATCAGCCCGAGAGTGTAAGGGCGTCAATAGCGCTGTGGACGAGACAGAGGGAATGGGGCAA GGAGCGAGGCTGGGGCTCTCACCGCGACTTGAATGTGGATGAGAGTGGGACGGTGACGGCGGGCGCGAAG GCGAGCGCATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATCAGTTTAATATCTGA TACGTCCTCTATCCGAGGACAATATATTAAATGGATTGATCAATCCGCTTCAGCCTCCCGAGTAGCTGGGA CTACAGACGGTGCCATCACGCCCAGCTCATTGTTGATTCCCGCCCCCTTGGTAGAGACGGGATTCCGCTAT ATTGCCTGGGCTGGTGTCGAACTCATAGAACAAAGGATCCTCCCTCCTGGGCCTGGGCGTGGGCTCGCAAA ACGCTGGGATTCCCGGATTACAGGCGGGCGCACCACACCAGGAGCAAACACTTCCGGTTTTAAAAATTCA GTTTGTGATTGGCTGTCATTCAGTATTATGCTAATTAAGCATGCCCGGTTTTAAACCTCTTAAAACAACTTT TAAAATTACCTTTCCACCTAAAACGTTAAAATTTGTCAAGTGATAATATTCGACAAGCTGTTATTGCCAAA CTATTTTCCTATTTGTTTCCTAATGGCATCGGAACTAGCGAAAGTTTCTCGCCATCAGTTAAAAGTTTGCGG CAGATGTAGACCTAGCAGAGGTGTGCGAGGAGGCCGTTAAGACTATACTTTCAGGGATCATTTCTATAGTG TGTTACTAGAGAAGTTTCTCTGAACGTGTAGAGCACCGAAAACCACGAGGAAGAGAGGTAGCGTTTTCAT CGGGTTACCTAAGTGCAGTGTCCCCCCTGGCGCGCAATTGGGAACCCCACACGCGGTGTAGAAATATATTT TAAGGGCGCG
计算机运算速度: 18个月增长一倍; DNA序列数据: 14个月增长一倍;
生物信息学
生物信息学 近年来GenBank中的DNA碱基数目呈指数增加,大约每14个月增 加一倍。到1999年12月其数目已达30亿,它们来自47000种生 物。2000年4月DNA碱基数目是60亿。现在,2001年初这一数目 已达110亿。 各种生物的EST序列已达600多万条,其中人类的EST序列已超 过300万条,估计覆盖人类基因90%以上; 自全长1.8Mb的嗜血流感杆菌(Haemophilus influenzae Rd) 基因组序列于1995年发表(Fleischmann et al.,1995)以来, 已有54个模式生物的完整基因组被测序完成,它们中有9个古 细菌、31个原核真细菌、14个真核生物的完整基因组或它们的 完整染色体,其中包括酿酒酵母和线虫。还有另外的70余个微 生物基因组正在测试当中。
生物信息学
第二讲 生物信息学现状和研究方 向刘吉平ຫໍສະໝຸດ 生物信息学主要内容
• • • • • • • 1、背景 2、定义 3、现状 1)生物数据库的发展 2)人类基因组计划逐步完成 3)科研文献的增长 4、研究目标
一. 什么是生物信息学?
•
生物信息学
Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition, processing, storage, distribution, analysis, and interpretation.
生物信息学
美国电脑执照--高薪阶层
• “BIOINFORMATICS CERTIFICATION” , 这是目前最新的一门生物化学工程与电脑技术 相结合的课程。 • Visual Basic -- $1195 • Visual C + + -- $1295 • BioInformatics -- $2500 • MIT(Massachusettes Institute of Technology) • (美国)麻省理工学院: Course: 20.01s Date: June 24 - 28, 2002 Tuition: $2,500
生物信息学
Bioinformatics: 科技界一颗耀眼 的新星
• 在 BIOINFORMATICS 没有诞生之前, 一个新药的问世需要十年时间,数亿美 元的 R&D ,而 BIOINFORMATICS 已将 这个过程减少三分之二, R&D 的费用也 相应大大减少。许多中小 BIOTECH 公 司也看到了 BIOINFORMATICS 的巨大 作 用 和 潜 在 的 商 机, 纷 纷 投 资 BIOINFORMATICS研究项目。
生物信息学
生物信息学
主讲教师: 刘 吉 平
E-MAIL: Liujiping@
艺术设计学院蚕桑分子生物学研究室 亚太地区蚕桑培训中心
2003年2月
生物信息学
一、概述
• 二十一世纪是生命科学的时代,也是信息时代 • 近年来,随着现代分子生物学的发展,特别是 人类基组计划的实施,不断产生出巨量的分子 生物学数据,这些数据有着数量巨大、关系复 杂,以至于不利用计算机根本无法实现数据的 存储和分析。这样,生物信息学最终形成一门 独立的学科并被推上了生物科学发展的最前沿。
生物信息学
二、生物信息学及其发展
• 生物信息学( Bioinformatics ) ---- 采用信息科学、计 算机科学、生物数学、比较生物学等学科的观点和方 法对生命的现象及其组成分子(核酸、蛋白等)进行 研究。主要研究生命中物质的组成、进化、结构与功 能的规律、以及这些物质在生命体中能量和信息的交 换或传递。该学科以计算机和生物电子设备为工具, 对生物信息进行提取、储存、加工和分析,用信息理 论技术及生物数学的方法去理解和阐述生物大分子的 存在和生命价值,最终对它们进行各种处理与应用。 通过这些处理和应用,科学家不仅能理解已有的核酸 和蛋白质序列及其功能,而且能更好地着手研究新的 基因和蛋白序列及其功能。
生物信息学
1、发展现状
• 生物信息学的发展将会对生命科学带来革 命性的变革。它的成果不仅对相关基础学 科起巨大的推动作用,而且还将对医药、 卫生、食品、农业等产业产生巨大的影响, 甚至引发新的产业革命。
生物信息学
生物医药工业推动生物信息学的发展
• 生物医药工业也是推动生物信息学发展的重要 动力。 HGP 所推动的大规模 DNA 测序也为生物医 药工业提供了大量可用于新药开发的原材料。 有些基因产物可以直接作为药物,而有些基因 则可以成为药物作用的对象。生物信息学为分 子生物学家提供了大量对基因序列进行分析的 工具,不但可以从资料的获取、基因功能的预 测、药物筛选过程中的信息处理等方面大大加 快新药开发的进程,而且可以大大加快传统的 基因发现和研究,因而成为各赢利性研究机构 和医药公司争夺基因专利的重要工具,这一竞 争又反过来极大的刺激了生物信息学的发展。
(1250 characters)
关键是先要从一个个序列片段中得到这本天书
生物信息学
已测序的重要模式生物: 人 家鼠 果蝇 线虫 拟南芥 水稻 大鼠 斑马鱼 酿酒酵母 番茄 玉米 布氏锥虫 菜豆 河豚 大肠杆菌 HIV 牛 疟原虫
生物信息学
1. 分子生物学和遗传学的文献积累从60年代 中期的接近10万篇迅速增长至60年代末期 的20多万篇,即在3-4年间,翻了一番。 2. 此后,至80年代中期,上升至约30万篇, 即平均每年增长6-7千篇。 3. 至90年代中,文献数已上升至40多万篇; 即在10年中,平均每年增长1万篇。 4. 到2000年,则增长至约50万篇,即在约5 年间,又增长了10万篇(根据 有关PubMed 数据整理)。
生物信息学
Dbcat统计的生物信息数据库的数目
分类 数据库数目 DNA 87 蛋白质 94 基因图谱 30 文献 43 分类 数据库数目 RNA 30 基因组 58 蛋白质结构 18 其他 153