浅谈生物信息学在生物医药方面的应用
生物信息学(Bioinformatics)是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。
它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。
其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。
具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。
基因组信息学,蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。
是结合了计算机科学、数学和生物学的一门多学科交叉的学科。
它依赖计算机科学、工程和应用数学的基础,依赖实验和衍生数据的大量储存。
他将各种各样的生物信息如基因的DNA序列、染色体定位、基因产物的结构和功能及各种生物种间的进化关系等进行搜集、分类和分析,并实现全生命科学界的信息资源共享。
从生物信息学研究的具体内容上看,生物信息学可以用于序列分类、相似性搜索、DNA序列编码区识别、分子结构与功能预测、进化过程的构建等方面的计算工具已成为变态反应研究工作的重要组成部分。
针对核酸序列的分析就是在核酸序列中寻找过敏原基因,找出基因的位置和功能位点的位置,以及标记已知的序列模式等过程。
针对蛋白质序列的分析,可以预测出蛋白质的许多物理特性,包括等电点分子量、酶切特性、疏水性、电荷分布等以及蛋白质二级结构预测,三维结构预测等。
基因芯片是基因表达谱数据的重要来源。
目前生物信息学在基因芯片中的应用主要体现在三个方面。
1、确定芯片检测目标。
利用生物信息学方法,查询生物分子信息数据库,取得相应的序列数据,通过序列比对,找出特征序列,作为芯片设计的参照序列。
2、芯片设计。
主要包括两个方面,即探针的设计和探针在芯片上的布局,必须根据具体的芯片功能、芯片制备技术采用不同的设计方法。
3、实验数据管理与分析。
对基因芯片杂交图像处理,给出实验结果,并运用生物信息学方法对实验进行可靠性分析,得到基因序列变异结果或基因表达分析结果。
尽可能将实验结果及分析结果存放在数据库中,将基因芯片数据与公共数据库进行链接,利用数据挖掘方法,揭示各种数据之间的关系。
大规模测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关。
目前,从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接
与组装、填补序列间隙,到重复序列标识、读框预测和基因标注的每一步都是紧密依赖基因组信息学的软件和数据库的。
特别是拼接和填补序列间隙更需要把实验设计和信息分析时刻联系在一起.拼接与组装中的难点是处理重复序列,这在含有约30%重复序列的人类基因组中显得尤其突出。
生物研究过程中大多数生物数据的处理是数学化的,需要自动提取模拟量信息。
DNA 测序仪信号的解释以及图像数据的分析就是获取数据的例子。
随着进行数据处理的计算机和从事出序列组装以获取一致序列的软件系统的完善与提高。
生物信息学以大规模序列信息产出为基本特征,除了对人类基因的测序外,还包括了多种模式生物体的基因组测序。
利用DNA 测序,可以预测基因序列中的功能区域,通过序列分析,比较工具可以对蛋白质、DNA 序列资料中各类信息进行识别和比较,寻找序列之间的同源性,揭示新发现的基因与功能。
通过比较序列库中的同源性,可以得到序列之间的进化关系,建立基因序列结构和功能的关系。
这就使得生物信息学不仅仅是生物信息的收集与分类,更主要是用来指导新的实验研究。
新确定的蛋白质结构与已确定的蛋白质之间不断地显示出结构和功能上的相似性、同源性,从已知基因的蛋白结构和功能,可以预测未知的同源基因的功能。
即由实验获得的某生物蛋白结构与功能信息可转换到另一生物的未知功能蛋白。
通过对蛋白质结构数据库的检索、比较,可以发现有趣的生物关系,确定是否具有与一种已知蛋白相似的三维结构。
只要这个基因结构与功能上的同源家族被确认,就可以利用这个基因家族中已知基因的结构、功能和它在生物体中的作用,来预测新基因的结构与功能。
X 衍射晶体学和核磁共振是推导大分子结构的主要方法,在其过程中会产生大量的数据,这些数据的解释完全依赖于高性能的计算机和复杂的处理算法。
对蛋白质空间结构的研究可以了解分子之间的识别机构和生化反应的原理,可以预测蛋白质具有的功能,也可提出抑制剂的结构特点,为药物设计提供思路。
人类基因组计划旨在阐明人类基因组核心昔酸的序列,发现所有的人类基因并阐明其在染色体上的位置,破译人类全部遗传信息,使得人类第一次在分子水平上认识自我。
目前HGP 已成为全球性的合作项目,提前实现了原定的作图计划,3万余个人类基因已被精确定位于染色体的各个区域。
人类基因组包含的8一10 万个基因进人了大规模DNA 测序和基因识别阶段,至今半数被识别,极大地带动了人类疾病相关基因的定位,克隆与结构、功能研究,其中15 00个与疾病相关基因已被克隆和申请专利。
6千多种人类单基因遗传病和那些严重危害人类健康的多基因病(如恶性肿瘤、心血管疾病等)将有可能由此得到预测、预防和治疗,农业、工业和环境科学也将从中受益。
在HGP 中,生物信息技术已被广泛用于基因序列数据的获取处理、分析和管理等许多方面。
生物信息学资源,尤其是基因组的信息资源,为药物作用靶的发现提供了难得的机遇。
利用生物信息学的生物信息和遗传信息来寻找和开发以基因为基础的药物。
通过筛选药物作用靶和候选对象来开发药物、疫苗、诊断标志物和有治疗作用的蛋白质。
在药物的发现过程中,一旦找到候选基因,就需从中鉴定出药物作用靶。
进行药物设计,通常是根据药物分子与大分子作用的互补原理,在受体结构的基础上反过来设计药物分子。
在药物的合成过程中,通过查找许多现成商品化的有机反应库,可以帮助合成生产者设计合成路线。
因为这些数据库中包括有许多化学反应,且每一个反应的反应后,通过集成系统,可以很方便地查询到有关化合物的性质及其市场信息。
市场需求信息和药物的营销,都需要借助生物信息学技术和资源。
从网络数据库中汇集各方面的信息,可以减少开发研究和生产的盲目性。
因此,可以看出,生物信息学应用计算机于生物学数据、化学数据和药理学数据的处理和分析,反映了现代信息技术在药物合成、设计制作和开发阶段应用的前景。
当前生物信息学在医学方面的主要任务包括以下几个方面:
①基因组相关信息的收集、存储、管理与提供。
②新基因的发现与鉴定。
⑧非编码区信息结构分析。
④生物进化的研究。
⑤完整基因组的比较研究。
⑥基因组信息分析方法的研究。
⑦大规模基因功能表达谱分析。
⑧蛋白质末端序列、分子空间的预测、模拟和分子设计。
⑨药物设计等。
生物信息技术在医药领域的应用涉及到新药开发、新诊断技术、预防措施及新的治疗技术,如单克隆抗体、基因诊断、荧光检测、基因芯片等。
这些技术可以快速、灵敏、简单地诊断疾病。
常用的疾病诊断方法有酶联免疫吸附检测法和DNA诊断技术。
单克隆抗体可以用于疾病治疗,也可用于疾病诊断。
如用于肿瘤治疗的生物导弹,是将治疗肿瘤的药物与抗肿瘤细胞的抗体连接在一起,利用抗体与抗原的亲和性,使药物集中于肿瘤部位以杀死肿瘤细胞,减少药物对正常细胞的毒副作用。
单克隆抗体更多地是用于疾病的诊断和治疗效果的评价。
再有,基因芯片技术可用于包括遗传性疾病、传染性疾病及肿瘤等疾病的诊断、DNA序列分析、药物筛选、基因表达水平的测定等领域。
这些都为改善人类健康和提高生命质量起到一定的促进作用。
生物信息技术的应用日益深广,不但对医学造成影响,也对工业、农业产生影响,生物冶金技术、生物信息工程的出现充分说明了这一点。
预计到21世纪,生物工程的发展,生物技术的应用将渗透到各领域各行各业。
各种动态表明,世界生物技术将迎来一个快速发展的新时代。
需要我们的努力让生物技术在医学和其他方面应用的更深、更好。