浅谈生物信息学在生物方面的应用生物信息学(bioinformaLics)是以核酸和蛋白质等生物大分子数据库及其相关的图书、文献、资料为主要对象,以数学、信息学、计算机科学为主要手段,对浩如烟海的原始数据和原始资料进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。
并通过对生物信息的查询、搜索、比较、分析,从中获得基因的编码、凋控、遗传、突变等知识;研究核酸和蛋白质等生物大分子的结构、功能及其相互关系;研究它们在生物体内的物质代谢、能量转移、信息传导等生命活动中的作用机制。
从生物信息学研究的具体内容上看,生物信息学可以用于序列分类、相似性搜索、DNA 序列编码区识别、分子结构与功能预测、进化过程的构建等方面的计算工具已成为变态反应研究工作的重要组成部分。
针对核酸序列的分析就是在核酸序列中寻找过敏原基因,找出基因的位置和功能位点的位置,以及标记已知的序列模式等过程。
针对蛋白质序列的分析,可以预测出蛋白质的许多物理特性,包括等电点分子量、酶切特性、疏水性、电荷分布等以及蛋白质二级结构预测,三维结构预测等。
生物信息学中的主要方法有:序列比对,结构比对,蛋白质结构的预测,构造分子进化树,聚类等。
基因芯片是基因表达谱数据的重要来源。
目前生物信息学在基因芯片中的应用主要体现在三个方面。
1、确定芯片检测目标。
利用生物信息学方法,查询生物分子信息数据库,取得相应的序列数据,通过序列比对,找出特征序列,作为芯片设计的参照序列。
2、芯片设计。
主要包括两个方面,即探针的设计和探针在芯片上的布局,必须根据具体的芯片功能、芯片制备技术采用不同的设计方法。
3、实验数据管理与分析。
对基因芯片杂交图像处理,给出实验结果,并运用生物信息学方法对实验进行可靠性分析,得到基因序列变异结果或基因表达分析结果。
尽可能将实验结果及分析结果存放在数据库中,将基因芯片数据与公共数据库进行链接,利用数据挖掘方法,揭示各种数据之间的关系。
生物信息学在人类基因组计划中也具有重要的作用。
大规模测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关。
目前,从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接与组装、填补序列间隙,到重复序列标识、读框预测和基因标注的每一步都是紧密依赖基因组信息学的软件和数据库的。
特别是拼接和填补序列间隙更需要把实验设计和信息分析时刻联系在一起.拼接与组装中的难点是处理重复序列,这在含有约30%重复序列的人类基因组中显得尤其突出。
人类基因组的工作草图即将完成,因此发现新基因就成了当务之急。
使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段,可以说大部分新基因是靠理论方法预测出来的。
比如啤酒酵母完整基因组(约1300万bp)所包含6千多个基因,大约60%是通过信息分析得到的。
当人类基因找到之后,自然要解决的问题是:不同人种间基因有什么差别;正常人和病人基因又有什么差别。
”这就是通常所说的SNPs(单核苷酸多态性)。
构建SNPs及其相关数据库是基因组研究走向应用的重要步骤。
1998年国际已开展了以EST为主发现新Spps 的研究。
在我国开展中华民族SNPs研究也是至重要的。
总之,生物信息学不仅将赋予人们各种基础研究的重要成果,也会带来巨大的经济效益和社会效益。
在未来的几年中DNA 序列数据将以意想不到的速度增长,这更离不开利用生物信息学进行各类数据的分析和解释,研制有效利用和管理数据新工具。
生物信息学在功能基因组学同样具有重要的应用目前应用最多的是同源序列比较、模式识别以及蛋白结构预测。
所谓同源序列,是指从某一共同祖先经趋异进化而形成的不同序列。
利用数据库搜索找出未知核酸或蛋白的同源序列,是序列分析的基础[lol。
如利用BLASTn和BLASTx两种软件分别进行核苷酸和氨基酸序列同源性比较。
同源性比较的结果大体可以分为如下几种方式:与生化和生理功能均已知的基因具有同源性;虽与生化和生理功能均已知的基因具同源性,但对该基因功能的了解尚不深入,仍停留在表达水平~I:;与其它物种中生化和生理功能均未知的基因具同源性。
同源性检索分析方法为该DNA片段的功能提供了间接的证据。
揭示序列数据所隐含的生物学意义的另一重要方法是模式识别技术。
顾名思义,模式别的基本思想是利用存在于蛋白质序列或结构中的某些特征模式识别相关蛋白质的性质。
如果某一蛋白质序列或结构中的一部分具有保守性,种保守性或者与蛋白质的生物活性有关,或者与蛋白质的折叠方式有关;那么,这种特片模式可以用来识别该蛋白家族中的新成员。
换句话说,如果将已知蛋白质的特征序列模式和特征结构模式搜集起来,构建成数据库.则可以用来确定新测定的蛋白质序列中是否具有某种特征模式,从而确定该未知蛋白属于哪个蛋白质家族。
这在治疗肾病问题上具有突破性进展。
生物信息学刚刚起步,但历史的经验告诉我们,未来它必将得到迅猛发展。
生物学是生物信息学的核心和灵魂,数学与计算机技术则是它的基本工具。
这一点必须着重指出。
学习有关的生物学知识,开展多方面的生物信息学研究,逐渐使我国成为生物信息学研究强国。
生物信息学在生物学研究中的应用摘要:生物信息学(Bioinformatics)生物信息学是一门新兴的、正在迅速发展的交叉学科,目前国内外对生物信息学的定义众说纷纭,没有形成统一认识。
概括来说,现代生物信息学是以核酸和蛋白质等生物大分子数据库及其相关的图书、文献、资料为主要对象,以数学、信息学、计算机科学为主要手段,对浩如烟海的原始数据和原始资料进行存储、管理、注释、加工,使之成为具有明确生物意义的生物信息。
并通过对生物信息的查询、搜索、比较、分析,从中获得基因的编码、凋控、遗传、突变等知识;研究核酸和蛋白质等生物大分子的结构、功能及其相互关系;研究它们在生物体内的物质代谢、能量转移、信息传导等生命活动中的作用机制。
目前,国际上公认的生物信息学的主要研究内容大致包括以下方面:①生物信息的收集、储存、分析、管理和提供;②基因组序列信息的提取和分析;③功能基因组相关信息分析;④生物大分子结构模拟和药物设计;⑤生物信息分析的技术与方法研究;⑥应用与发展研究。
2.生物信息在生物学研究上的应用2.1 基因组学研究基因组(genome)表示一个生物体所有的遗传信息的总和。
一个生物体基因所包含的信息决定了该生物体的生长、发育、繁殖和消亡等所有生命现象。
有关基因组的研究称为基因组学(Genomics),基因组学根据研究重点的不同分为序列基因组学(Sequence genomics)、结构基因组学(Structural genomics)、功能基因组学(Functional genomics)与比较基因组学(Comparative genomics)。
结构基因组学的研究:结构基因组学(Structural genomics)是基于基因组学的一个重要组成部分和研究领域,它是一门通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学口。
生物信息学在结构基因组学中的应用主要在于:基因组作图、核苷酸序列信息分析、基因定位、新基因的发现和鉴定等方面。
比较基因组学的研究:借助生物信息学的手段对不同生物基因组的比较、分析,可以进行生物进化等方面的研究。
功能基因组学的研究:功能基因组学(Functional genomics)是指在全基因组序列测定的基础上,从整体水平研究基因及其产物在不同时空、条件下的结构与功能关系及活动规律的学科。
功能基因组的研究是后基因组时代的关键点,它将借助生物信息学的技术平台,利用先进的基因表达技术及庞大的生物功能检测体系,从浩瀚无垠的基因库筛选并确知某一特定基因的功能,并通过比较分析基因及其表达的状态,确定出基因的功能内涵,揭示生命奥秘,甚至开发出基因产品。
2.2 蛋白质组学的研究蛋白质组(proteome)是指一个基因组,一种生物或一种组织/细胞所表达的全套蛋白质,蛋白质组学(proteomics)是以蛋白质组为研究对象的新的研究领域,主要研究细胞内蛋白质的组成及其活动规律,建立完整的蛋白质文库。
现有的蛋白质研究方法。
如双向电泳等电聚焦(2一D),色谱分析,质谱分析等,都需要特殊设备且价格昂贵;体外翻译表达系统可研究蛋白质的加工,释放和亚细胞定位,但操作烦琐,而生物信息学为我们提供了一条可以直接由基因或蛋白质序列进行蛋白质功能预测和结构分析的捷径。
生物信息学在蛋白质组学方面的研究主要在于以下两个方面:蛋白质的结构与功能的研究:现有的研究结果表明,蛋白质的结构与功能有着密切的关系,尤其是蛋白质的三维结构。
通过研究蛋白质三维结构可以预测其特定的功能。
通过计算机辅助预测将序列、结构与功能分析等方法联系起来,可克服同源建模、折叠识别、threading 以及聚类分析法等方法的不足。
生物信息学在蛋白质结构研究中的应用主要有:(1)靶点的选择;(2)同源性模拟;(3)基于结构基础上的功能的研究等。
蛋白质分子相互作用及其作用途径的研究:检测蛋白质分子间相互作用的方法,一是通过实验。
另一种是通过计算机法,如启动子分析技术。
该技术的理论基础是,共调节基因的产物通常处于同一代谢通路中,而且,共表达意味着拥有共同的启动子或增强子。
通过已知基因的作用途径来预测其相关基因的作用途径。
但是,由于目前没法获得足够的参考数据,所以,对预测蛋白质分子间的相互作用及其作用途径的方法还很难进行评估。
试验方法获得的有关蛋白质间的作用的数据主要来自于酵母双杂交实验,用这种方法得到的有关蛋白质间相互作用的方式只是结构域间的作用,并不代表完整蛋白分子间的作用方式,且作用的时间和地点也都发生了改变。
因此,通过计算机技术模拟生物大分子的相互作用是一条比较理想的研究途径。
生物信息学的发展将给生命科学研究带来革命性的变革,将帮助人类认识生命的起源、进化、遗传和发育的本质,揭示人体生理和病理过程的分子基础,为人类疾病的预测、诊断、预防和治疗提供合理和有效的方法或途径,同时还将对医药、卫生、食品、农业等产业产生巨大的推动作用,甚至可能引发新的产业革命。
21世纪是生命科学的时代,生物信息学为生命科学的发展提供了便利和强有利的技术支持,推动着生命科学的迅速发展。
生物信息学在蛋白质组学中的应用摘要:生物信息学是一门新兴的边缘学科,基因组合蛋白质组研究与生物信息学技术互相推动,并行发展,而生物信息学在蛋白质研究中将发挥特殊作用。
本文就生物信息学技术在蛋白质数据库以及蛋白质结构分析与功能预测中的应用做一综述。
关键词:生物信息学蛋白质组数据库结构分析功能预测1 前言20世纪80年代,随着基因组学和蛋白质组学的发展,数据量迅速增加,生物信息学(bioinformatics) 就应运而生。
它研究的重点内容为基因组(Genomics) 和蛋白质组学(Proteomics)。