生物医学大数据概述
Moore’s Law
生物信息学概述
生命科学大数据 的挑战与实践
生物医学信息学 技术
生物信息与医学大数据概述
15
2020/3/16
生命科学大数据的挑战与实践
生命科学大数据概况 生命科学“大数据”挑战 GWAS和药物基因组学 中国人群肝癌的个性化图谱群
数据分享与挖掘
16
2020/3/16
生命科学大数据的挑战与实践
生命科学大数据概况 生命科学“大数据”挑战 GWAS和药物基因组学 中国人群肝癌的个性化图谱群
高科技野外生态学
High-tech field ecology
计算生态学 Computational ecology
动态系统建模 Dynamical
system modelling
12
2020/3/16
计算生物学的复杂性
13
2020/3/16
生物信息学和系统生物学
14
2020/3/16
第二部分
• Molecular evolution
• Protein structure, folding, function & interaction
• Metabolic pathways regulation
• Signaling Networks
• Physiology & cell biology
6
2020/3/16
研究内容
数据库建设 数据库整合和数据挖掘 序列分析 结构分析与功能预测 大规模功能表达谱的分析 代谢网络建模分析
预测调控网络 网络普遍性分析 模型分析 程序开发 商业化
7
2020/3/16
研究内容
数据库建设 数据库整合和数据挖掘 序列分析 结构分析与功能预测 大规模功能表达谱的分析 代谢网络建模分析
每个碱基与人类基因的检测成本急速下降
Throughput (Gb) 240 120 100
80 60 40 20 3Gb 0
2007
22
NGS通量的革新
人类基因的检测成本
200Gb-300Gb
$M
100,000.00
10,000.00
13 years ~$3,000,000,000
1,000.00 100.00
SRA碱基积累率成指数增长。 WGS序列仍是传统序列中的组成部分。
T2h1e International Nucleotide Sequence Database Collaboration, Nucleic Acids Research, 2011, 1–5 doi:10.1093/nar/gkr1006
遗传学与基因组学
4
2020/3/16
人类基因组计划之后取得的成就
5
Nature 2011, 470: 204–213
2020/3/16
研究内容
数据库建设 数据库整合和数据挖掘 序列分析 结构分析与功能预测 大规模功能表达谱的分析 代谢网络建模分析
预测调控网络 网络普遍性分析 模型分析 程序开发 商业化
预测调控网络 网络普遍性分析 模型分析 程序开发 商业化
8
Roche 454
Illumina HiSeq 2000
ABI SOLiD
2020/3/16
研究内容
数据库建设 数据库整合和数据挖掘 序列分析 结构分析与功能预测 大规模功能表达谱的分析 代谢网络建模分析
数据分享与挖掘
17
2020/3/16
个性化遗传背景
30亿碱基对,22000个基因,30万蛋白质。 个性化遗传差异:300万bp。
18
2020/3/16
1000基因组
人类基因变异的深层目录
19
2020/3/16
医学:大数据
340亿
1亿3500万 大于80亿
20
100万
2020/3/16
INSDC碱基对,分解为选定的数据部分
蛋白质结构预测、折叠、设计
Protein structure prediction, protein dynamics, protein folding and design
数据格式、标准化及分析复杂生物数据工具
Data standards, data representations, and analytical tools for complex biological data
预测调控网络 网络普遍性分析 模型分析 程序开发 商业化
9
2020/3/16
研究内容
数据库建设 数据库整合和数据挖掘 序列分析 结构分析与功能预测 大规模功能表达谱的分析 代谢网络建模分析
预测调控网络 网络普遍性分析 模型分析 程序开发 商业化
Genome sequencing 转录组学
蛋白质组学 Transcriptomics
基因组数据分析
Genomic data analysis
统计遗传学
Statistical genetics
Proteomics
代谢组学 metabolomics
功能基因组学 (生物芯片等)
Functional genomics (microarrays)
生物信息与医学大数据概述
刘雷 生物医学研究院 医学系统生物学系
2016. 09. 14
生物信息学概述
生命科学大数据 的挑战与实践
生物医学信息学 技术
生物信息与医学大数据概述
2
2020/3/16
第一部分
生物信息学概述
生命科学大数据 的挑战与实践
生物医学信息学 技术
生物信息与医学大数据概述
3
2020/3/16
• Interspecies interaction
• Ecology & environment
Experiment
Computation
Information Technology
Hardware & instrumentationMathematical & Physical Models
基因组测序
10
2020/3/16
研究内容
数据库建设 数据库整合和数据挖掘 序列分析 结构分析与功能预测 大规模功能表达谱的分析 代谢网络建模分析
预测调控网络 网络普遍性分析 模型分析 程序开发 商业化
11
2020/3/16
生物信息学
• DNA Sequence
• Gene & genome organization