当前位置:文档之家› 我想象中的生物信息学

我想象中的生物信息学

我想象中的生物信息学
作为一个习惯于游走于各大实验室,经常需要称量和测定的生物学专业的我来说,生物信息学是一个复合词,也是一个较为“高大上”的词汇,毕竟,它与当今最热门、最具吸引力和最伟大的计算机技术挂钩了。

这种奇妙的组合,就像具有不同优良性状作物之间的远缘杂交,不由让我对生物信息学这个新兴学科臆想连篇。

今天是2050年12月1日。

夏鑫正坐在办公室里,聚精会神地看着来自国家电视台有关新型病毒HIL(High Infection Lethal)在东南亚肆虐的新闻报道。

夏鑫的办公室位于北京的中国生物大数据研究中心大夏里。

中国生物大数据研究中心直属于国家信息部,以各种生物数据挖掘与开发为核心内容,集产、学、研为一体的科研机构。

夏鑫,作为药物生物信息学领域的专家之一,已经在这个行业深耕差不多40多年了。

“这次要来的家伙可能不好对付。

”夏鑫自言自语说道。

的确,这次新爆发的疫情与以前有所不同,其侵染的病毒是一种极其凶险与难缠的核糖核酸类病毒。

丝条状,长约1000纳米,能够通过血液、唾液、汗液等体液进行传播,一旦被它侵染,感染者会在10分钟以内全身发黑、抽搐、直至死亡。

从现场的一些尸检发现,死者血液里的红细胞不足0.1%,且骨髓内的造血干细胞全部死亡。

夏鑫不由寒颤,脸上出现少有的不安,但很快,他的注意力就被办公室电脑吸引,如他所料,东南亚愈演愈烈的疫情,必将引起中国政府的高度重视,现在他的电脑就接受到上级分派的任务。

任务是快速对HIL病毒的RNA 分析并依照目前利用X射线衍射晶体结构得到的某些重要的病毒表达调节分子,设计能与其作用的药物。

这项任务对一位有多年经验的专家来说,并非难事,只是速度一定要快!夏鑫首先对手上的RNA利用特定算法进行全方位分析,划分出调控区,编码区,并进行世界各大病毒基因组数据库的比对,锁定重要区域。

这些步骤并不需要多长时间,大概2min。

这有赖于全球各大数据库的双轨道链接以及超高速的带宽传输,另外,每位生物信息学工作者都配备了高性能的计算机并掌握凝集众多科研人员心血的多功能信息学大软件。

接着就是对分析的数据进行生物学注释。

在未开发基因组和蛋白组注释数据库时,生物学注释对于大多拥有高超计算机能力但生物知识缺乏的生物信息学工作者来说,可以说是一大难题。

这种不对称不单大大影响生物信息的效率,而且引起某些错误的注释。

经过两个
多小时的高强度工作,夏鑫终于整理出几个维持病毒功能必需而在耐药性形成不易发生突变的蛋白侧链。

夏鑫紧张的神经稍微放松了一些,他心里想:这次病毒应该可以从中药蛋白库或世界药物库中找到一些化合物,经修饰后,专一性作用于这些侧链的。

病毒感染者也就能重获新生。

夏鑫不再多想,继续埋头寻找和设计抗HIL病毒药物。

20世纪60-70年代,生物信息学在核酸和蛋白质分析和测序技术日趋进步的背景下应运而生。

最初的生物信息学受限于算法,只能进行基本的比对。

如今,生物信息学经过几十年的成长,从小苗逐渐长成灌木,枝繁叶茂。

一系列组学计划的实施,庞大的核苷酸序列、氨基酸序列以及蛋白质的二维和三级结构等数据急剧膨胀,生物信息学作为一种有力的工具,对部分数据进行了组织整理,并赋予一定的生物学含义。

现在,只要你拥有一台能连接互联网的电脑,就能感受到生物信息学给我们生命科学工作者带来的便利。

假如你拥有一段未知的基因序列,你可以访问NCBI或EMBL,利用你的序列对拥有海量数据并日益增长的数据库,进行相似性搜索,从而得到这段序列的编码区、氨基酸序列以及编码蛋白等信息。

这些为你下一步的研究工作提供一些参考。

这在二十世纪初很难想象,那时候的生物化学家用有机化学的的方法研究三大物质的代谢途径,研究一些酶的组成和生理作用,等等。

同时,他们没有分子生物学知识,只是对各种实验现象进行观察和记录。

现阶段,生物信息学的发展是乐观的。

核酸序列数据库、蛋白质序列数据库、结构数据库等数据库得以建立;序列比对被用作推断新克隆基因的功能、构建和预测蛋白质家族结构与功能以及获取生物进化关系;对蛋白质的结构进行预测;克服传统药物设计的随机性和盲目性,辅助药物设计;发现和鉴定新基因和SNP。

以上所说也仅是生物信息学众多领域的一些方面,毫无疑问,在将来,生物信息学将扮演越来越重要的角色。

药物的设计与开发是生物信息学参与的一个重要领域,也是生物医药发展过程不可忽视的一方面。

这也正是我脑海里首先对生物信息学辅助药物研发与治疗抱有想象的原因。

众所周知,一种针对某种疾病治疗药物的研发与应用需要历经的时间是漫长的。

一般是从矿物质、植物以及动物当中进行人工的寻找和筛选,或经过化学的合成来形成药物的先导物,然后在先导化合物确定无误后,再对其进行分析,完善和优化。

最后对候选药物进行临床的药剂量、副作用以及个体化
差异等评价,最终将其投入到市场当中。

而生物信息学的参与,可以利用现有的数据库对靶点进行识别,高效筛选出先导化合物,并且,根据不同病人基因实现个性化治疗,从而减少工作的盲目性,促进药物推向市场。

至此,我们已经对生物信息学的发展历史和现状有了一些了解。

那么,作为推动生命科学成为21世纪重要学科的主力军之一,生物信息学的未来在哪里?这也正好对应上了题目中的“我想象中的生物信息学”。

对数据有更可靠与更快速的解读。

一些国内生物信息学大牛感慨,现在该行业的很多工作者都是“半路出家”的。

如果无法对数据进行解读,也就很难转化成真正的科研成果。

人才素质会不断提高,但生命科学研究领域十分广泛,且不说基础生物学和医学科学中有多少细分学科,单说农林牧渔各个方向所涉及的数据特点和分析策略都不尽相同,这就要求有很多生命科学和计算机知识兼备的科研人员。

培养人才的周期是很长,但生物学数据却以好几倍的速度剧增。

所以,个人认为,要想实现对如今庞大的生物数据更可靠与更快速的解读,未来必须要附加上人工智能。

人工智能自身具备一定的学习能力,计算能力速度之快远甩人类几条街。

现在的生物信息学科研人员已经开发和设计出很多的程序和算法,它们功能强大,但却十分紊乱,各自得到的结果有较大差异,这令人难以取舍。

假如真的有一天,经过众多人工智能专家和生物信息学专家能设计出一套能对基因进行预测分析和注释的专家系统,那样我们将能从浩瀚的生物学数据快速地发现更多进化和生命系统的秘密,并且这些相对可靠的数据也将大大地促进如药物学、免疫学和临床医学的研究。

计算决定生物的未来。

不可否认,在生物领域,实验最可靠,实验是金标准,实验不会错,如果计算结果与实验不符,那一定是计算不靠谱。

将来,这种固化的思维可能发生稍微的转变。

一些生物信息学者经过对生物淘选的实验结果研究发现,有些实验结果存在以子之矛、攻子之盾的地方,他们由此开发出一套能评价实验结果靠谱不靠谱,甚至能够用不靠谱数据集建模来预测实验结果数据是否真实的系统。

基于此,生物信息学有可能将不再只是一位尾随的拾荒者,而成为以后生命科学研究的监督者或主要参与者。

这是很尴尬的,一门实验学科竟然变成一门计算科学。

不过,这应该是有理由的,当更多的生命奥妙被揭开,我们能从实验中得到的数据也将减少,这时,我们将会转向一直被遗忘的生物数据库。

相关主题