当前位置:文档之家› 生物信息学

生物信息学


蛋白质设计
疾病诊断 疾病治疗 开发新药
生物分子信息处理流程
20112011-3-31 31
分子生物学的三大核心数据库
• GenBank核酸序列数据库 GenBank核酸序列数据库 • SWISS-PROT蛋白质序列数据库 SWISS-PROT蛋白质序列数据库 • PDB生物大分子结构数据库 PDB生物大分子结构数据库
20112011-3-31
19
生物分子至少携带着三种信息
– 遗传信息 – 与功能相关的结构信息 – 进化信息
20112011-3-31
20
(1)遗传信息的载体 (1)遗传信息的载体——DNA 遗传信息的载体——DNA
遗传信息的载体主要是DNA 遗传信息的载体主要是DNA
控制生物体性状的基因是一 系列DNA片段 系列DNA片段 生物体生长发育的本质就是遗 传信息的传递和表达
20112011-3-31
3
第一章 生物信息学引论
20112011-3-31 4
简介
一.引言 二.生物信息学的发展历史 三.人类基因组计划和基因组信息学 四.蛋白质结构与功能关系的研究 五.目前生物信息学主要研究内容 六.生物信息学所用的方法和技术
20112011-3-31 5
第一节 引言
化学
目前基本共认的假设),蛋白质结构的 目前基本共认的假设),蛋白质结构的 ), 信息隐含在蛋白质序列之中。 信息隐含在蛋白质序列之中。
20112011-3-31
24
(3) DNA分子和蛋白质分子 DNA分子和蛋白质分子 都含有进化信息
• 通过比较相似的蛋白质序列,如肌红蛋白 通过比较相似的蛋白质序列 相似的蛋白质序列,
• 在医学上的重要意义
– 为疾病的诊断和治疗提供依据 – 为设计新药提供依据
20112011-3-31
生物信息学将是21世纪生物学的核心 生物信息学将是 世纪生物学的核心
34
主要研究内容
破译遗传语言、 破译遗传语言、识别基因 预测蛋白质结构和功能 认识生物界信息存贮和传递的本质 研究药物作用机制和开发新药
20112011-3-31
35
第二节 生物信息学的发展历史
生物科学和 技术的 发展 人类基因组 计划的 推动
生物信息学 基本思想的产生
生物信息学 的迅速发展
二十世纪 50年代
20112011-3-31
二十世纪 80-90年代
36
20世纪50年代,生物信息学开始孕育 20世纪 年代 世纪50年代, 20世纪60年代,生物分子信息在概念上将计算 20世纪 年代 世纪60年代, 生物学和计算机科学联系起来 20世纪70年代,生物信息学的真正开端 20世纪 年代 世纪70年代, 20世纪70年代到80年代初期 ,出现了一系列著 20世纪 年代到 年代初期 世纪70年代到80 名的序列比较方法和生物信息分析方法 20世纪80年代以后,出现一批生物信息服务机 20世纪 年代以后 世纪80年代以后, 构和生物信息数据库 20世纪90年代后 ,HGP促进生物信息学的迅速 20世纪 年代后 HGP促进生物信息学的迅速 世纪90 发展
表1.1 至2001年初已经得到的各类数据及基本数据处理任务 20112011-3-31 33
生物信息学研究意义
• 认识生物本质
– 了解生物分子信息的组织和结构,破译基因组 了解生物分子信息的组织和结构, 信息,阐明生物信息之间的关系。 信息,阐明生物信息之间的关系。
• 改变生物学的研究方式
– 改变传统研究方式,引进现代信息学方法 改变传统研究方式,
20112011-3-31
10
高性能计算服务器, 高性能计算服务器,图形工作站
20112011-3-31
11
高端的计算集群
20112011-3-31
12
高度灵活的可扩展的计算集群
20112011-3-31
13
20112011-3-31
14
2、生物分子信息
分子
生物信息的载体
细胞
存贮、复制、 存贮、复制、传递和表达 遗传信息的系统
20112011-3-31 40
模式生物
酵母
线虫
大肠杆菌
老鼠
20112011-3-31
果蝇
41
20世纪 世纪 三大科学计划
曼哈顿原子弹计划 (1942-46) ) 阿波罗登月计划 (1961-69)
人类基因组计划 (1990-2003)
20112011-3-31 42
为什么提出HGP? ? 为什么提出
20112011-3-31
32
数据源 DNA序列 DNA序列
数据量 11.5百万条序列 11.5百万条序列 125.0 亿个碱基
生物信息学任务 分离编码与非编码区域 识别内含子与外显子 基因产物预测 基因功能注释 基因调控信息分析 序列比较 多重序列比对 识别保守的序列模式 进化分析 二级结构、空间结构预测 三维结构比对 蛋白质几何学度量 表面和形态计算 分子间相互作用分析 分子模拟 标注重复序列 基因结构分析 系统发生分析 基因与疾病的连锁分析 基因组比较 遗传语言分析 达模式相关分析基因表 基因调控网络分析 表达调控信息分析
蛋白质序列
40.0万条序列(每条序列平均有300 40.0万条序列(每条序列平均有300 氨基酸 )
大分子结构
1.5 万个结构 (每个结构平均1000个原子坐标) (每个结构平均1000个原子坐标)
基因组
300个基因组 300个基因组
基因表达
酵母6000个基因 酵母6000个基因 在约20时间点表达值 在约20时间点表达值
20112011-3-31
15
• 生物信息学主要研究两种信息载体
– DNA分子 DNA分子 – 蛋白质分子
20112011-3-31
16
20112011-3-31
17
Protein Machines
20112011-3-31
18
From the Cell to Protein Machines
20112011-3-31
29
3、生物信息学的目标和任务
• 收集和管理生物分子数据 • 数据分析和挖掘 • 开发分析工具和实用软件
生物分子序列比较工具 基因识别工具 生物分子结构预测工具 基因表达数据分析工具
20112011-3-31
30
应用
基因工程
实验
收集
数据
表示 刻画特征
信息
分析 比较
知识
建模 推理
22
DNA
基因的DNA序列 DNA序列 DNA
前体RNA 对 应 关 系 遗 传 密 码 mRNA
蛋白质序列
20112011-3-31
多肽链
23
(2)蛋白质的结构决定其功能 (2)蛋白质的结构决定其功能
• 蛋白质功能取决于蛋白质的空间结构 蛋白质功能取决于蛋白质的空间结构 功能取决于蛋白质的空间 • 蛋白质结构决定于蛋白质的序列(这是 蛋白质结构决定于蛋白质的序列 序列(
20112011-3-31
37
关于生物信息学发展历程中的重要大事, 关于生物信息学发展历程中的重要大事, 请参见下面两个网站的介绍: 请参见下面两个网站的介绍:
/Education /BLASTinfo/milestones.html、 、 /bioinformatics/。 。
20112011-3-31
25
生物分子数据类型
DNA序列数据 最基本 生 物 分 子 信 息 生物分子功能数据
20112011-3-31
蛋白质序列数据
直观 生物分子结构数据
复杂
26
遗传密码
DNA 核酸序列
蛋白质 氨基酸序列
蛋白质 结构
蛋白质 功能
最基本的 生物信息
生命体系千姿 百态的变化
维持生命活 动的机器
生物信息学
主讲教师: 主讲教师: 高雪峰
E-mail:gaoxf@ mail:
吉林大学生命科学学院
20112011-3-31 1
课程安排
1、时间:每周一下午5~8节 、时间:每周一下午 ~ 节 教室: 教室:第三教学楼第二阶梯教室 学时:每周4学时 总计4× 学时( 学时) 学时:每周 学时(总计 ×4=16学时) 学时 2、学分:2学分 、学分: 学分 3、成绩考核方式(笔试) 、成绩考核方式(笔试) 4、E-mail: gaoxf@ 、 办公室地址:理三341室) (办公室地址:理三 室
物理 生命信息的组织、 传递、表达
分子 生物学
信息技术
20112011-3-31
遗传学
6
1、 生物信息学概念
生物学家
HGP 生物数据的激增 (每15个月翻一番)
数学家
生物信息学 (bioinfomatics) 的诞生
计算机 科学家
20112011-3-31
7
概念(广义) 概念(广义)
生物体系和过程中信息 的存贮、传递和表达 信息科学 细胞、组织、器官的生理、病理 、药理过程的中各种生物信息 生 命 科 学 中 的 信 息 科 学
20112011-3-31
8
概念(狭义)
生物分子信息的获取、存贮、 生物分子信息的获取、存贮、分析和利用
分子生物信息学 Molecular Bioinformatics
生物 分子数据
获取 深层次 生物学知识 挖掘
20112011-3-31
9
Bioinformatics
生物分子 数据 + 计算机 计算
20112011-3-31
2
参考文献
1、《生物信息学概论》 生物信息学概论》 罗静初 北京大学 北京大学出版社 生物信息学》 2、《生物信息学》 D.R. Westhead 科学出版社 生物信息学—基因和蛋白质分析的使用指南》 3、《生物信息学—基因和蛋白质分析的使用指南》 李衍达 清华大学 清华大学出版社 生物信息学中的计算机技术》 4、《生物信息学中的计算机技术》 孙超 中国电力出版社 生物信息学手册》 5、《生物信息学手册》 郝柏林 中科院物理所 上海科学技术出版社 简明生物信息学》 6、《简明生物信息学》 钟扬 复旦大学 高等教育出版社
相关主题