《生物信息学》PPT课件
19
多老了?
1960s已有建立数据库、序列分析、 开发算法,当时叫分子进化
如果考虑生物数学,19世纪已经流行 首次提出Bioinformatics的说法
荷兰理论生物学家1980年代初Ben Hesper和Paulien Hogeweg
马来西亚生化物理学家林华安(Hwa A. Lim)于1987年
/sci/techresources/Human_ Genome/home.shtml
人类基因组计划(Human Genome Project, HGP) 由美国能源部(Department of Energy, DOE)和美国国立卫生研究院
(National Institutes of Health, NIH)组织完成 1990年10月开始,2003年4月完成(1953双螺旋) 参与国:美、英、日、法、德、中 并没有完成测序(2006.5完成)
热点 生物大分子的结构与功能研究 基因组与细胞的研究 脑科学和神经科学研究 行为科学研究 关于遗传、发育、分化、进化的综合理论研究 生态环保研究
15
物理学的发展对生命科学的启示
物理学
生命科学
17世纪
大量实验数据积累
农业、医药实践 博物学
经典物理学 公式化
18世纪
分类、解剖研究
机械论完善
价格
目前价格: 10000美元(细菌) 目标: 1000美元 趋势: 过去十几年,每2年半价
微小化、并列化: 数千到数十万well 多目标化: 肠内几十上百种微生物、土壤中全部微
生物同时测序 最小基因组研究、基因组人工合成
8
蛋白数据增长(PDB)
9
反应通路(KEGG)
glycolysis pathway(糖酵解)
19世纪
近代生物学 进化理论
应用物理
相对论、量子力学 20世纪遗传学、分子生物学
现代物理
现代生物学
非线性物理、复杂系统21世纪大量实验数据2积1世累纪的生物学
16
公式化?
二、生物信息学简介
17
什么是生物信息 学(1)
bioinformatics
= bio + informatics
生物
信息学
相关学科
京都基因与基因 组百科全书 (Kyoto Encyclopedia of Genes and Genomes)
10
全细胞通路
11
人类基因组计划(1) – 人类三大计 划
曼哈顿原子弹计划 (1942-46)
12
阿波罗登月计划 (1961-69)
人类基因组计划 (1990-2003)
人类基因组计划(2)
古细菌(archaea) 54
细菌(bacteria) 694
包括草履虫、疟原虫、弓形虫、酵 真核生物(eukaryota) 78 母、线虫、果蝇、海藻、水稻、鸡、
鼠、狗、人、黑猩猩等
7
2008.9
测序进展
GenBank中已超过2000亿碱基对 速度
目前速度: 10天一个基因组(细菌) 目标: 1天一个基因组
5
为什么这么快
6
Sanger, UK
已完成测序的基因组(EBI)
病毒(virus) 类病毒(viroid)
1639
包括多种流感病毒, 病毒等
HIV,
SARS冠状
46
主要是植物病毒
质粒(中
噬菌体(phage) 469
细胞器(organelle) 1510
如线粒体、叶绿体
2003.4
测序速度 和费用
500 Mb/年,< 0.25 美元/bp
> 1400 Mb/年,< 0.09 美元 /bp
2002.11
序列变异 10万SNP
3.7百万SNP
2003.2
基因识别 全长cDNA
15000全长cDNA
2003.3
模式生物
大肠杆菌、酵母菌、线虫(C)、 果蝇(D)基因组序列
13
人类基因组计划(3) – 超额完成目 标
领域
目标
实际达到
完成时间
完成时间 15年
13年
2003.4
遗传图 2-5厘摩,600-1500个标记 1厘摩,3000标记
1994.9
物理图 30000 STS
52000 STS
1998.10
DNA序列 95%含基因序列,99.99%
99%,99.99%精确
生物信息学
第一章 绪论
毛理凯
初步计划讲授内容
1.
绪论
2. 生物信息学的计算机基础
3. 生物信息学资源与数据挖掘工具
4. DNA序列分析
5. 分子系统发育分析
6.
基因组分析
7. 蛋白质组分析
8.
数学模型
2
本课目录
一.
当今生命科学展望
二.
生物信息学简介
三.
发展现状
3
一、当今生命科学展望
4
基因数据的 快速增长
最早提到该词的文献(PubMed) (1990)Genomics,6(2):389
20
生物信息学发展阶段(1)
前基因组时代(pre-genomics era)
建立生物数据库(1965, Margaret Dayhoff的Atlas of Protein Sequences; 1982,GenBank Release 3)
除完成上述,C. briggsae, D. pseudoobscura,大小鼠草图
2003.4
功能分析 发展基因组水平的技术
高通量寡核苷酸合成、DNA 微阵列、酵母全基因组水平敲 除、蛋白双杂交
1994, 1996, 1999,2002
14
生命科学的发展趋势和热点
发展趋势 系统生物学: 微观还原,系统 统一生物学(General Biology) 生物技术的产业化
对位算法(1970,NeedlemanWunsch; 1981,Smith-Waterman)
计算生物学(computational biology)
系统生物学(systems biology)
18
什么是生物信息学(2)
/faq/#definitions (大致地)计算机对生物信息的处理 (多数人认为,面窄)计算分子生物学(computational molecular biology) (宽松地)甚至包括医疗成像、图像分析、遗传算法、人工智能、神经网络… (经典)用计算机储存、比较、提取、分析、预言、模拟生物分子的组成与结 构。主要应用(core)是序列分析 (新)比较基因组学、功能基因组学、蛋白质组学、结构基因组学