生物信息学课堂ppt课件
它是一门理论概念与实践应用并重的学科 ❖ bioinformatics这一名词在1991年左右才在文献中出现,还
只是出现在电子出版物的文本中。
5
产生 生物信息学的
❖ 20世纪后期,生物科学技术迅猛发展,无论从数量上还是从质量上都 极大地丰富了生物科学的数据资源。数据资源的急剧膨胀迫使人们寻求 一种强有力的工具去组织这些数据,以利于储存、加工和进一步利用。 而海量的生物学数据中必然蕴含着重要的生物学规律,这些规律将是解 释生命之谜的关键,人们同样需要一种强有力的工具来协助人脑完成对 这些数据的分析工作。
❖ 基因组时代--基因寻找和识别、网络数据库系统的 建立、交互界面的开发;
❖ 后基因组时代--大规模基因组分析、蛋白质组分析。
8
重要性 生物信息学的
❖ 生物信息学不仅是一门学科,更是一种重要的研究开发工具。 ❖ 从科学的角度来讲,生物信息学是一门研究生物和生物相关
系统中信息内容与信息流向的综合系统科学。只有通过生物 信息学的计算处理,人们才能从众多分散的生物学观测数据 中获得对生命运行机制的系统理解。 ❖ 从工具的角度来讲,生物信息学几乎是今后所有生物(医药) 研究开发所必需的工具。只有根据生物信息学对大量数据资 料进行分析后,人们才能选择该领域正确的研发方向。 ❖ 生物信息学不仅具有重大的科学意义,而且具有巨大的经济 效益。它的许多研究成果可以较快地产业化,成为价值很高 的产品。
分析(主要研究内容) 应用(多个领域)
主要由数据库、计算机网络和应用软件三大部分构成
2
定义
❖ 收集、维护、传播、分析以及利用在分子生物学研究中获得的大量数据。
生物信息学(bioinformatics)是生物学与计算机科学以及应用数学等学
科相互交叉而形成的一门新兴学科。它通过对生物学实验数据的获取、
绪论
❖ 什么是生物信息学?
❖ 生物信息学的产生
❖ 生物信息学发展过程
❖ 生物信息学的基本方法
❖ 生物信息学的研究内容
❖ 生物信息学的应用
❖ 基因组信息学的首要任务
❖ 生物信息学的重要研究课题
❖ 生物信息学的商业价值
❖ 通过学习应逐渐掌握的内容
1
什么是生物信息学?
产生(分子生物学研究中获得的大量数据) 收集(数据库) 维护(产生高质量数据) 传播(互联网,搜索引擎)
理解这些生物大分子信息的生物学意义的交叉学科。现代分子生物学的
发展,特别是人基因组计划的实施,使生物学家所面对的数据不再是实
验记录本上或文献上的几行简单数字,而是公共数据库中数以千兆计的
记录。
3
定义
❖ 基因组信息是生物信息中最基本的表达形式,并且 基因组信息量在生物信息量中占有极大的比重,但 是,生物信息并不仅限于基因组信息,生物信息学 也不等于是基因组信息学。广义的说,生物信息不 仅包括基因组信息,如基因的DNA序列、染色体定 位,也包括基因产物(蛋白质或RNA)的结构和功 能及各生物种间的进化关系等其他信息资源。
加工、存储、检索与分析,进而达到揭示数据所蕴含的生物学意义的目
的。由于当前生物信息学发展的主要推动力来自分子生物学,生物信息
学的研究主要集中于核苷酸和氨基酸序列的存储、分类、检索和分析等
方面,所以目前生物信息学可以狭义地定义为:将计算机科学和数学应
用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到
9
生物信息学的基本方法:
❖ 建立生物数据库:核苷酸顺序数据库(GENBANK)、Protein Data Bank(PDB)、氨基酸顺序数据库(SWISS-PRO)、酵母基因组数据库 (YEASTS)、美国种质保藏中心(ATCC)、美国专利局数据库(USPO)。
❖ 数据库检索:Blast ❖ 序列分析:序列对位排列、同源比较、进化分析。 ❖ 统计模型:如隐马尔可夫模型(hidden Markov model, HMM)--基因识别、
❖ 对基因组研究相关生物信息的获取、加工、存储、分配、分 析和解释:
❖ 人类基因组计划(human genome project,HGP):1990年启动,10年 时间完成草图(3x10e9个碱基对,并对30,000多个基因进行了注释)。
❖ 越来越多的微生物和其他模式生物也完成了全基因组测序工作。
发展过程 生物信息学的
大致经历了3个阶段:
❖ 前基因组时代--生物数据库的建立、检索工具的开 发、DNA和蛋白质序列分析、全局和局部的序列对 位排列;
4
产生 生物信息学的
❖ 80年代未人类基因组计划(Human genome project)的启动 ❖ 生物实验和衍生数据的大量储存 ❖ 涉及生物学、数学、计算机科学和工程学,依赖于计算机科
学、工程学和应用数学的基础 ❖ 建立、更新生物数据库及获取生物数据而联合使用多项计算
机科学技术的应用性学科 ❖ 不仅仅是只限于生物信息学这一概念的理论性学科。事实上,
药物设计。最大似然模型(maximun likelihood model, ML)、 最大简约法 (Maximun Parsimony, MP)--分子进化分析。 ❖ 算法:如自动序列拼接、外显子预测和同源比较、遗传算法、人工神经 网络(artificial neural network)。
10
研究内容 生物信息学的
❖ 另一方面,以数据分析、处理为本质的计算机科学技术和网络技术迅猛 发展,并日益渗透到生物科学的各个领域。于是,一门崭新的、拥有巨 大发展潜力的新学科——生物信息学——悄然兴起。
生物信息学=生物学数据+计算机科学技术+网络技术
6
生物信息学发展过程
❖ 早在1956年,在美国田纳西州盖特林堡召开的首次“生物学中的信 息理论研讨会”上,便产生了生物信息学的概念。
❖ 20世纪50年代末 数学模型、统计学方法和计算机处理宏观生物学数据。 数量分类学、数学生态。
❖ 1987年,这一学科被正式命名为“生物信息学”(bioinformatics)。 此后,其内涵随着研究的深入和现实需要的变化而几经更迭。
❖ 应用于分子生物学:分子生物学数据库、蛋白质结构分析与预测。
❖ 1995年,在美国人类基因组计划第一个五年总结报告中,给出了一 个较为完整的生物信息学定义