生物信息学研究进展制药工程121班张明星 12773009摘要:生物信息学是生物技术的核心,是一门由生物、数学、物理、化学、计算机科学、信息科学等多学科交叉产生的新兴学科。
本文介绍了生物信息学的概念、经历阶段以及生物信息学的主要研究内容等,论述生物信息学发展的现状以及它的未来发展趋势。
以求我们对生物信息学有更深入的了解。
关键词:生物信息学;新兴学科;现代信息技术;研究进展21世纪是生命科学的时代,也是信息科学的时代。
从20世纪80年代末开始,生物信息学这一多学科交叉产生的新兴学科蓬勃发展,并日渐成为21世纪自然科学的核心领域[1]。
作为多学科结合的综合性学科,生物信息学通过信息学、统计学、化学、物理学、计算机等手段对人类基因组计划及其相关衍生计划所产生的海量数据进行科学的分析,极大地提高了研究效率,缩短了研究时间,在当今遗传资源争夺、分秒必争的残酷竞争中生物信息学逐渐承担起越来越重要的角色。
1.研究意义生物信息学是当今生命科学的重要领域之一,也是21世纪给自然科学带来革命性变革的热门领域之一。
分子生物学在20世纪后半叶发展迅速,生物分子水平的技术发展和研究手段高度自动化,使得众多物种从细菌到人类的基因和蛋白质数据正在以科学史上从未有过的高速度增长[2]。
生物信息学的成果不仅对相关基础学科起到巨大的推动作用,而且还将对医药、卫生、食品、农林牧业等产生巨大的影响,引发新的产业革命。
各国政府和工业界对此极为重视,投入了大量资金。
欧美各国及日本相继成立了生物信息研究机构和生物信息数据中心,通过计算机网络使得各国生物信息资源实现共享[3]。
另外,生物信息学对未来军事和国防的影响也不容忽视。
因此对生物信息学的研究十分必要。
2.经历阶段生物信息学自产生以来,大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段。
2.1前基因组时代前基因组时代产生于20世纪90年代前。
这一阶段的标志性工作包括生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析等[4]。
2.2基因组时代基因组时代产生于20世纪90年代后至2001年。
这一阶段的标志性工作包括基因识别与发现、网络数据库系统的建立和交互界面工具的开发等。
2.3后基因组时代后基因组时代为2001至今。
随着人类基因组测序工作的完成,各种模式生物基因组测序的完成,生物科学的发展已经进入了后基因组时代,基因组学研究的重心由基因组的结构向基因的功能转移。
这一阶段的标志则是大规模基因组分析、蛋白质组分析以及各种数据的比较与整合。
3.研究内容生物信息学是伴随基因组研究而发展的。
它以人类基因组计划完成为标志,经历了两个历史时代,即测序基因组时代和功能基因组时代。
其研究重点主要体现在基因组学和蛋白组学两方面。
具体说,是从核酸和蛋白质序列出发,分析序列中表达的结构与功能的生物信息。
其研究内容主要包括:(1)新基因的发现与鉴定;(2)完整基因组的比较研究;(3)大规模基因功能表达谱的分析;(4)生物大分子的结构模拟与药物设计;(5)非编码区信息结构分析;(6)遗传密码起源和生物进化的研究。
4.研究现状4.1国外研究现状国外非常重视生物信息学的发展,各种专业研究机构和公司如雨后春笋般涌现出来,生物科技公司和制药工业内部的生物信息学部门的数量也与日俱增。
美国早在1988年在国会的支持下就成立了国家生物技术信息中心(NCBI),其目的是进行计算分子生物学的基础研究,构建和散布分子生物学数据库;欧洲于1993年3月就着手建立欧洲生物信息学研究所(EBI),日本也于1995年4月组建了信息生物学中心(CIB)。
目前,绝大部分的核酸和蛋白质数据库由美国、欧洲和日本的3家数据库系统产生,他们共同组成了DDBJ/E M L/Gen Bank国际核酸序列数据库,每天交换数据,同步更新。
以西欧各国为主的欧洲分子生物学网络组织(European Molecular Biology Network, EMB Net),是目前国际最大的分子生物信息研究、开发和服务机构,通过计算机网络使英、德、法、瑞士等国生物信息资源实现共享[5]。
在共享网络资源的同时,他们又分别建有自己的生物信息学机构、二级或更高级的具有各自特色的专业数据库以及自己的分析技术,服务于本国生物(医学)研究和开发,有些服务也开放于全世界。
从专业出版业来看,1970年,出现了Computer Methods and Programs inBiomedicine这本期刊;到1985年4月,就有了第一种生物信息学专业期刊—Computer Application in the Biosciences。
生物信息技术的强力介入使制药业正发生天翻地覆的变化。
2014年,IBM与生物信息技术相关的年销售额达到30亿美元,这也可从一方面说明IBM为什么要在超级计算机研究领域遥遥领先[6]。
4.2国内研究现状在我国,生物信息学随着人类基因组研究的展开才刚刚起步,目前还处于初期发展阶段,但在一些著名院士和教授的带领下,在各自领域取得了一定成绩,显露出蓬勃发展的势头,有的在国际上还占有一席之地。
如北京大学的罗静初和顾孝诚教授在生物信息学网站建设方面、中科院生物物理所的陈润生研究员在EST序列拼接方面以及在基因组演化方面、天津大学的张春霆院士在DNA序列的几何学分析方面、中科院理论物理所郝柏林院士、清华大学的李衍达院士和孙之荣教授、内蒙古大学的罗辽复教授、上海的丁达夫教授等等。
北京大学于1997年3月成立了生物信息学中心,这个中心在1996年欧洲 EMB Net扩大到欧洲之外时已正式成为中国结点(每个国家只有一个结点),目前已有60多种生物数据库的经常更新的镜像点[7]。
中国科学院于1997年9月和12月召开了第80、87次香山会议,首次邀请有关专家就“DNA芯片的现状与未来”和“生物信息学”进行探讨[8]。
1999年3月,清华大学生物信息学研究所、国家人类基因组北方研究中心和北京生物技术和新医药产业促进中心共同举办了“北方生物信息学学术研讨会”。
1999年4月,北京大学举办了“国际生物信息学讲习班”。
2001年4月,由北京市科技委员会、中国人类基因组北方研究中心、中国人类基因组南方研究中心、北京华大基因研究中心、军事医学科学院、北京生物工程学会生物信息学专业委员会、北京生物技术和新医药产业促进中心等共同举办的首届“中国生物信息学大会”在北京召开[9]。
2014年11月28日,中国科协“生物信息学与进化计算”第81次青年科学家论坛在北京中国科技会堂成功召开。
这是国内首次以“生物信息学”为主题的一次多学科交叉的青年科学家论坛[10]。
与会者一致认为系统生物学、非编码区功能研究、基因调控和相互作用网络等是当前生物信息学研究的热点问题。
5.生物信息学研究面临的挑战未来生物学领域的高效研究发现将有赖于生物信息学的发展,而目前生物信息学却存在不少的难题有待解决。
首先,生物信息学理论研究明显薄弱。
生物信息学对许多学科都提出了巨大的挑战,包括分子进化遗传学、群体遗传学、统计生物学、基因组学以及计算机科学和应用数学等相关学科。
如果基础理论研究得不到应有的发展,生物信息学的发展将受到严重制约[11]。
其次,生物学领域中各种不同来源数据的有效整合处理将面临3方面的挑战:计算基础设施、数据模式和预测分析模式。
计算基础设施包含了数据存储和数据处理能力两个方面;数据建模的挑战是如何建立一个可用的、可发展的生物学数据模式;而预测分析模式的挑战则是如何高效、自动化地获取有用的科学假设。
6.展望生物信息学是一门热点前沿学科,它与多种学科交叉渗透。
现代信息技术则是它不可或缺的研究手段。
生物信息学的进步依赖于相关学科不断突破的同时,其发展又为这些学科的进步提供信息、材料及研究方法。
生物信息学的研究进展表明,生物技术日益需要信息技术,并且越来越依赖信息技术现在许多信息技术手段,尤其是数据挖掘技术如何更紧密更实际地与生物信息学的研究相结合仍然处于不断的探索之中[12]。
就其整个学科而言,其发展历史不长,因此无论是理论上还是方法上,都还有许多亟待解决的问题,蕴藏着极大的研究潜力。
针对目前的研究现状,生物信息学尚需解决以下几方面的问题。
6.1加强基础科学研究生物信息学对分子生物学、统计生物学、计算机科学和应用数学等相关学科的发展提出了挑战,同时也为这些学科的发展提供了新素材、新工具和新思路。
如利用比较基因组学进行分子水平的系统发育分析,研究生命是从哪里起源的,生命是如何进化的,遗传密码是如何起源的,估计最小独立生活的生物至少需要多少基因,这些基因是如何使它们生活起来的等生命科学的基本问题,将为探索物种起源、揭示生命奥秘提供有力的帮助[13]。
6.2研发高效算法及支持软件生物信息学中多处存在着算法优化及建模问题。
基因测序过程中的序列拼接与组装、图谱绘制、序列比对、系统发育分析、蛋白质结构预测、分子模拟及药物设计等都需要高效算法及易用软件的支持。
6.3发展数据库集成与资源再加工技术网络上的公共数据库在物理上散布于各地,数据资源都带有不同程度的信息冗余或缺失,需要在数据加工基础上建立二级以上的数据库及相应的处理分析工具,以便为世界各地的科学家提供快速高效的信息服务[14]。
相应地,应当在数据质量控制、数据资源的标准化、网络传输、多数据库系统集成以及数据挖掘、知识发现等各方面加以研究,发展相应的技术。
参考文献[1]欧阳曙光,贺福初,生物信息学:生物实验数据和计算技术结合的新领域[J].科学通报,2010,44(14):1457-1468.[2]Baba Y.Development of novel biomedicine based on genome science[J].Eur J Pharm- Sci,2011,13(1):3-4.[3]贺林.解码生命之人类基因组计划和后基因组计划[M].北京:科学出版社,2000.[4]郝柏林,张淑誉.生物信息学手册[M].上海:上海科学技术出版社,2015.[5]Bitter T, Muir H M.A modified uronic acid carbalzole reaction[J].Anal Biochem, 2014, 4:330-333.[6] MEYER K, PALMER J W. The polysaccharide of the vitreous houmor [J]. J Biol Chem, 2013, 107: 629-633.[7] EVERED D,WHELAN J. The Biology of Hyaluronan [M]. Chichester: John Wiley & Sons,2010.[8]钱小红,贺福初.功能基因组与蛋白质组[M].北京:科学出版社,2013:1-23.[9]段民孝.基因组学研究概述[J].北京农业科学,2011,2:6-10.[10]刘玉庆,王禄山.生物信息学及其在农业上的应用前景[J].山东农业科学,2011,5:51-54.[11]赵爱民.生物信息技术发展态势分析[J]。