生物信息学的应用
前基因组时代 基因组时代 后基因组时代 生物信息学的发展脉络: ➢ 1918975年6年,,佛在罗美里国达田州纳立西大州学盖32特岁林的堡林华安 ((WaG.aAt.lLiinmb)ur博g)士召首开创的“首Bi次oi“nf生or物ma学ti中cs的”信息 理论研讨会”上,孕育了生物信息学的概念. 一词,被誉为“世界生物信息之父”。
基因表达数据分析是目前生物信息学研究的 热点和重点
目前对基因表达数据的处理主要是进行聚类 分析,将表达模式相似的基因聚为一类,在 此基础上寻找相关基因,分析基因的功能
精品课件
基因芯片
精品课件
二 维 电 泳 图
精品课件
5、蛋白质结构预测
蛋白质的生物功能由蛋白质的结构所决 定 ,蛋白质结构预测成为了解蛋白质功 能的重要途径
精品课件
➢ 1990年,林华安博士发起第一届国际 Bioinformatics学术会议。
➢ 1990年10月,被誉为生命科学“阿波罗登月计划” 的国际人类基因组计划(HGP)启动。
➢ 1995年,美国人类基因组计划第一个五年总结报 告中给出生物信息学一个较为完整的定义。
➢ 2000年6月26日,美、英、日、德、法、中等六 国科学家共同努力,完成人类基因组工作草图,这是 人类科学史上又一个里程碑式的事件。
是否未知蛋白序列与已知功能的蛋白质相似
确定跨膜螺旋、卷曲螺旋和前导序列
未知序列是否包含保守序列模体
查对PROSITE数据库库
查对BLOCKS和PRINTS数据库
整理所有肯定的结果并核对一致性
预测蛋白质功能
蛋白质功能预测流prediction/subprediction/functionalflowchat.asp)
➢ 2003年4月14日,国际人类基因组测序组隆重宣 布:美、英、日、德、法和中国科学家历经13年共同 努力,人类基因组序列图(“完成图”)提前绘制成 功。人类迈入“后基因组精品时课件代”(Post-genomic Era)。
(二)生物信息学的主要研究内容
1.生物信息的收集、存储、管理与提供 2.基因组序列信息的提取和分析 3.功能基因组相关信息分析 4.基因表达数据的分析与处理 5. 蛋白质结构预测
蛋白质结构预测分为:
二级结构预测 空间结构预测
精品课件
蛋白质折叠
二级结构预测
在一定程度上二级结构的预测可以归结为模式识别问题
在二级结构预测方面主要方法有:
立体化学方法 图论方法 统计方法 最邻近决策方法 基于规则的专家系统方法 分子动力学方法 人工神经网络方法
预测准确率超过70%的第一个软件是基于神经网络的PHD 系统
生物信息学的应用
精品课件
生物信息学 (Bioinformatics)
生物分子
数据
+
计算机 计算
精品课件
概念(广义)
生
生物体系和过程中信息
命
的存贮、传递和表达
科
学
中
信息科学
的
信
细胞、组织、器官的生理、病理 药理过程的中各种生物信息
息 科 学
精品课件
概念(狭义)
生物分子信息的获取、存贮、分析和利用
分子生物信息学 Molecular
Bioinformatics
生物 分子数据
获取 挖掘
精品课件
深层次 生物学知识
生物信息学主要研究两种信息载 体
DNA分子 蛋白质分子
精品课件
生物分子至少携带着三种信息
遗传信息 与功能相关的结构信息 进化信息
精品课件
第一节 生物信息学与基因组学
一、生物信息学概述 (一)生物信息学发展简史 生物信息学发展的3个阶段:
精品课件
(一)蛋白质序列分析
序列比对是生物信息学的基础,通过比较两个或 多个蛋白质序列的相似区域和保守性位点,确定 相互间具有共同功能的序列模式和分子进化关系, 进一步分析其结构和功能。
把未知结构的蛋白质序列与已知具有三维结构的 蛋白质序列进行序列比对,有助于进一步了解该 未知结构蛋白质的空间折叠信息
精品课件
1、 生物分子数据的收集与管理
EMBL
基因组 数据库
GenBank DDBJ
蛋白质 序列 数据库
SWISS-PROT PIR
蛋白质 结构 数据库
PDB
精品课件
2、 数据库搜索及序列比较
搜索同源序列在一定程度上就是通过序列比较寻找 相似序列
序列比较的一个基本操作就是比对(Alignment), 即将两个序列的各个字符(代表核苷酸或者氨基酸 残基)按照对应等同或者置换关系进行对比排列, 其结果是两个序列共有的排列顺序,这是序列相似 程度的一种定性描述
实现基因组数据、蛋白质组和结构基因组数 据、天然及合成化合物数据的计算机处理、分析 和可视化,以及生物实验和生物分子的模拟设计, 解析蛋白质三维结构和蛋白质组的时空表达关系 等
精品课件
二、生物信息学与蛋白质
蛋白质研究为生物信息学提供了极为 丰富的研究数据,极大地推动了生物 信息学的发展。生物信息学在蛋白质 的序列分析、结构预测、功能预测、 分子设计等方面具有重要应用。
精品课件
(二)蛋白质结构预测
蛋白质结构预测内容 二级结构预测 三维结构预测
蛋白质结构预测方法 理论分析方法:是在理论计算的基础上进行结构
预测。 统计分析方法:是在对已知结构的蛋白质进行统
计分析的基础上,建立由序列到结构的映射模型,对未知 结构的蛋白质直接从氨基酸序列预测其结构。
精品课件
(三)蛋白质功能预测
精品课件
空间结构预测
在空间结构预测方面,比较成功的理论 方法是同源模型法
该方法的依据是:相似序列的蛋白质倾 向于折叠成相似的三维空间结构
运用同源模型方法可以完成所有蛋白质 10-30%的空间结构预测工作
精品课件
(三)生物信息学研究现状与展望
1.国外生物信息学研究现状 2.我国生物信息学研究现状 3.我国生物信息学研究目标
多重序列比对研究的是多个序列的共性。序列的多 重比对可用来搜索基因组序列的功能区域,也可用 于研究一组蛋白质之间的进化关系。
精品课件
发现同源分子
精品课件
3、 基因组序列分析
遗传语言分析——天书 基因组结构分析 基因识别 基因功能注释 基因调控信息分析 基因组比较
精品课件
4、基因表达数据的分析与处理