生物信息学教案2010
还原论思想 生物并非只是物质的简单堆积,生物体的生长发育是生命信息控制之下的复杂 而有序的过程。如果说物理学是研究物质和能量的学科,那么生命科学就是研究生 命物质基础上的信息的学科。 我们对生命的奥秘还不甚了解,对生命信息的组织、传递和表达还知之甚少。 既然这牵涉到信息的组织、传递和表达,我们就可以用信息科学的方法和技术来尝 试认识和分析生命信息。
3
按历史顺序 介绍重要事 件ቤተ መጻሕፍቲ ባይዱ
注意结合领 域前沿问题 讲解,调动学 生学习兴趣。
综合论思想。综合论方法研究基因和各种生物大分子是怎样通过网络 调控方式形成一个生物系统的。提出了层次抽提和相互作用网络等概 念。
1.2.2 我国生物信息学发展现状
我国的生物信息学工作是逐步发展起来的。20 世纪 80 年就有若干科研院所的 生物、物理、信息、数学等学科的工作者从事生物信息学的研究工作。 近几年来,国内对生物信息学的研究和应用越来越重视。 我国在基因组信息的收集与发布方面开展了一些工作 目前,我国基因组和蛋白质组研究在国际上已经占据了重要的地位;在生物信 息学研究和应用方面,相信经过科学家的努力,经过多学科专家的合作,完全有可 能赶上甚至超过世界先进水平。 介绍国内有 关单位和有 关专家
1.1.2 生物信息学的研究目标和任务
揭示生物分子数据隐含的生物学信息是其长远目标和根本任务。 目前生物信息学的主要任务包括 3 个方面: 第一是收集和管理生物分子数据。 第二是进行数据处理和分析。目前生物信息学的主要研究对象是 DNA 和蛋白 质。在 DNA 分析方面,着重分析 DNA 序列中的基因信息及基因表达调控信息,分 析基因表达数据,分析基因之间的相互作用关系,比较不同种属的基因组,研究基
§1.1 引言
随着基因组计划的迅速发展,生物数据的积累速度不断加快。因此,也就对生 物数据的科学分析方法和实用分析工具提出了更新、更高的要求。在这个过程中, 需要对实验数据进行处理并及时进行理论分析,在此基础上解释实验现象,认识导 致实验现象发生的本质,在“整合” 、 “系统”等全新理念下探索固有的生物学规律, 进而了解和掌握生命的物质基础和生命的本质。
2
课程名称:生物信息学
授课章节 目的要求 重点难点
第 1 章 生物信息学引论(6 学时)
介绍生物信息学的基本概念,指出生物信息学的研究目标和任务、研究意义、基本 方法和前沿技术。 重点:生物信息学概念。 难点:生物信息学与其他生物学科的观念上的革新 对照“综合 论”解释 “生物信息 学”产生的背 景
4、
R. Durbin 等 Biological sequence analysis-Probabilistic models of proteins and nucleic acids 2002 年 清华大学出版社
授课对象:生物技术 生物工程本科 课程性质:生物技术专业必修课 生物工程专业选修课 学时:课堂 40 学时,上机 10 学时(自愿)
1.4.1 生物分子数据的收集与管理
有组织地搜集和管理这些数据是各项工作的前提。具体的工作包括构建数据库 系统,建立网络服务器,开发数据查询和搜索工具,设计数据分析软件和数据可视 化软件。 生物信息学发展很快,各种数据库不断涌现,并各有不同的特色。 对于核酸序列, 有 3 个权威组织在管理各自的数据库, EMBL、 GenBank 和 DDBJ。 蛋白质序列数据库:美国生物医学基金会建立的 PIR 及瑞士生物信息学研究所 和欧洲分子生物学实验室共同维护的 SWISS-PROT 著名的蛋白质结构数据库是:美国 Brookhaven 实验室的大分子数据库 PDB。 数据库的内容十分丰富,除上述 DNA 序列、蛋白质序列和结构数据库之外,还 有表达序列标记数据库、序列标记位点数据库、蛋白质序列功能位点数据库、基因 图谱数据库等一些具有特殊功能的数据库。
§1.4 生物信息学的主要研究内容
研究范畴是以基因组 DNA 序列的信息分析作为出发点, 分析基因组结构, 寻找 或发现新基因,分析基因调控信息,并在此基础上研究基因的功能,研究基因的产 物即蛋白质,模拟和预测蛋白质的空间结构,分析蛋白质的性质,其结果将为基于 靶分子结构的药物分子设计和蛋白质分子改性设计提供依据。 生物信息学主要有以下几个方面的研究内容。 结合最新发 展方向讲解, 力求让学生 学习生物信 息学最新的 动态。
1.3.2 前沿技术
(1)、数据管理技术 集中式大型分子数据库(如 GenBank, EMBL 和 DDBJ 等) 。 新的发展趋势是应用互操作(database interoperation)以及数字图书馆(digital library)技术来进行异构数据库集成。 (2)、数据仓库、数据挖掘与数据库中的知识发现技术 (3)、图像处理与可视化技术
以国家自然 科学基金、 863 计划、香 山会议等介 绍
§1.3 生物信息学的基本方法与前沿技术
1.3.1 基本方法
目前,生物信息学研究的基本方法主要有以下几种 (1)、建立生物数据库 针对生物信息学特定的研究与开发工作,必须建立自己的数据库或数据获取界 面。 (2)、数据库检索 越来越多的数据库检索工具已投入实际应用。 (3)、序列分析 分 子 序 列 分 析 是 生 物 信 息 学 的 核 心 方 法 , 包 括 从 序 列 对 位 排 列 (Sequence
1.1.1 生物信息学基本概念
无论从理论上来讲还是从实际情况来看, 生物信息学的实质就是利用数理知识、 信息和计算机科学及技术来研究生物学信息的组织、传递和表达规律等问题。 广义的生物信息学是指以核酸蛋白质等生物大分子为主要研究对象,以信息、 广义概念 数理、计算机科学为主要研究手段,以计算机网络为主要研究环境,以计算机软件 为主要研究工具,对序列数据进行存储、管理、注释、加工,对各种数据库进行查 询、搜索、比较、分析,构建各种类型的专用数据库信息系统,研究开发面向生物 学家的新一代计算机软件;并利用数理统计、模式识别、动态规划、密码解读、语 意解析、信令传递、神经网络、遗传算法以及隐马氏模型等各种方法,对序列、结 构数据进行定性和定量分析,从中获取基因编码、基因调控、序列-结构-功能关系等 理性知识,阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律和时空联 系, 探索生命起源、 生物进化、 生命本质等重大理论问题, 最终建立“生物学周期表”。 计算分子生物学主要研究分析方法,开发分析工具,促进生物分子数据的分析。 相 关 领 域 定 义 生物计算主要是用计算机技术分析和处理生物学数据。
4
alignment) ,到序列同源比较和进化分析,直至基因组分析和蛋白质组分析等。 (4)、统计模型 越来越多的统计模型已用于生物信息学研究。例如,隐马尔可夫模型(hidden Markov model,HMM)在基因识别和药物设计中具有重要的应用价值;最大似然模 型(maximum likelihood model,MLM)已成为序列进化分析中的一种常规方法。 (5)、算法 在生物信息学实际工作中已建立了大量算法,如自动序列拼接、外显子预测和 同源比较算法等。
1.4.2 数据库搜索及序列比较
从 5 个方面论 述
§1.2 生物信息学的产生与发展
1.2.1 生物信息学的发展历史
生物信息学的发展大致经历了 3 个阶段: (1) 前基因组时代(20 世纪 90 年代前) 20 世纪 50 年代,生物信息学就已经开始孕育。 1962 年,Zucherkandl 和 Pauling 研究序列变化与进化之间的关系,开创了一个 新的领域——分子进化。 1964 年,蛋白质结构预测的研究由 Davies 的工作开始。氨基酸序列的收集是这 个时期的一项重要工作,1967 年 Dayhoff 发表了蛋白质序列图集,该图集后来演变 为著名的蛋白质信息源(PIR) 。 20 世纪 60 年代是生物信息学形成雏形的阶段。 从 20 世纪 70 年代初期到 80 年代初期,出现了一系列著名的序列比较方法。 在 20 世纪 70 年代,还不断涌现出许多生物信息分析方法。 20 世纪 80 年代以后,出现了一批生物信息服务机构和生物信息数据库。 (2) 基因组时代 (20 世纪 90 年代后至 2001 年) 生物信息学的真正发展则是在 20 世纪 90 年代,在人类基因组计划的推动下, 生物信息学才得以迅猛发展。 (3) 后基因组时代 (2001 年至今) 随着后基因组时代的到来, 生物信息学研究的重点逐步转移到功能基因组信息 研究。其具体表现在: (1) 将已知基因的序列与功能联系在一起进行研究; (2) 从以常规克隆为基础的基因分离转向以序列分析和功能分析为基础的 基因分离; (3) 从单个基因致病机理的研究转向多个基因致病机理的研究; (4) 从组织与组织之间的比较来研究功能基因组和蛋白质组,组织与组织 之间的比较主要表现在:正常与疾病组织之间的比较,正常与激活组 织之间的比较,疾病与处理(或治疗)组织之间的比较,不同发育过 程的比较等 (5) 标志是大规模基因组分析、 蛋白质组分析以及各种数据的比较和整合。 出现了蛋白质组学、药物基因组学、比较基因组学、功能基因组学、 系统生物学、整合生物学等学科。 (6) 研究思路也发生了本质的变化,从传统的还原论研究生命过程转到了 综合论思想 综合论方法研究基因和各种生物大分子是怎样通过网络
生
物 教
信 案
息
学
2010/2011 第一学期
教师
蔡
禄
内蒙古科技大学 数理与生物工程学院
2010 年 9 月
1
教材: 蔡禄 生物学信息教程 2006 年 北京 化学工业出版社 主要参考书: 1、 2、 3、 孙啸 等 生物信息基础 2004 年 清华大学出版社
T K Attwood 等 Introduction to Bioinformatics2002 年 北京大学出版社 李衍达 孙之荣译 Bioinformatics:A practice guide to the analysis of genes and proteins 2000 年清华大学出版社