生物催化工程的第三次浪潮过去的十年里,由于科技的进步,无论是实验室还是工业规模都已确定用具实用性并且环保的生物催化来代替化学合成中的传统的金属催化和有机催化。
DNA测序以及基因合成的关键进展是基于剪切生物催化剂通过蛋白质工程和设计,及将酶整合入新的生物合成途径的能力取得的巨大进步。
为了突出这些成就,在此我们讨论了以酶催化作为关键步骤,将蛋白质-动力学生物催化剂应用于从通用化学品到先进医药中间体的范围。
生物催化是对合成化学中微生物和酶的应用,作为自然界的催化用于新的目的:酶的应用还未涉及到[1-5]。
通过几次技术研究创新的浪潮,目前生物催化领域已达到其企业成熟水平。
图1酶发现的进程及用于确定所需催化剂的蛋白质工程策略理性设计(b)基于蛋白结构(a)或是同源模建识别不同的突变位点,而随机突变(c)与筛选或是选择结合是定向进化实验的基础。
结合这些方法使构建更小型但更智能的数据库(d)成为可能。
现在通过富集培养(e)对酶进行传统筛选已被关键的主题数据库检索(f)代替以指导新型酶或是他们具备的所需特性的确定。
在其初期仍是酶的设计(g)的从头计算(从头合成de novo)。
内部结构指的是通过生物催化不同的浪潮可得到的进行化学物质。
(R)-苯乙醇腈(左)在100年前的植物提取物中已经获得;(1S,3S)-3-氨基环己醇(中)由Novartis公司利用一种固定化酯酶制成;6-氯-2,4,6-3脱氧-D-赤型六吡喃环(右)由DSM用一个设计的醛缩酶耐受高浓度乙醛并且获得高选择性的过程制的。
生物催化的第一次浪潮(图1),始于一个多世纪以前,科学家认识到活细胞的组成成分可以应用于有效地生物转化(相对于几千年已经司空见惯的发酵过程)。
例如,Rosenthaler利用一种植物提取物从苯甲醛和氰化氢合成的(R)-苯乙醇腈[6];发生在微生物细胞内的类固醇的羟化[7]也已知。
较新的例子即洗衣粉中蛋白酶的利用[8]。
葡萄糖异构酶将葡萄糖转化为更甜味的果糖[9],青霉素G酰基转移酶制备半合成抗体[10]。
这些应用关键挑战在于生物催化剂稳定性的限制及诸如此类的缺点主要通过酶的固定化来克服,这也有利于酶的重复利用。
生物催化的第二次浪潮,在20世纪80到90年代,最初的蛋白质动力学技术,代表性的即基于结构的技术,扩大了酶的底物范围以允许异常的合成中间产物的合成。
这一变化将生物催化扩展到医药中间体和精细化学品的制备。
实例包括脂肪酶催化水解手性前体用于合成地尔硫卓(一种治疗血压药物),醇腈酶催化合成醇类对映异构体应用于降胆固醇抑制素药物,脂肪酶催化合成蜡酯类物质例如肉豆蔻醇肉豆蔻酸酯或是十六烷基蓖麻醇酸酯用于化妆品工业,以及腈类水合酶催化水合丙烯腈形成丙烯酰胺用于高分子材料(这类腈类水合酶已在紫红红球菌全细胞中获得)。
除固定化之外,目前的挑战包括优化用于非天然底物的催化剂。
现阶段,生物催化的第三大浪潮开始于20世纪九十年代中后期Pim Stemmer 和Frances Arnold的工作。
他们首创了分子生物学方法,通过达尔文进化论体外实验快速大量地修饰催化剂。
尽管这一术语于1972年的全细胞实验中曾被用过,现在这一方法通常称为定向进化,这一技术的最初方法涉及到在一个蛋白质中氨基酸的随机突变的迭代循环法,随后从酶稳定性提高,底物特异性以及对应选择性的突变体形成的库中筛选法。
讨论到此,今后的发展已经集中于提高定向进化的效率以产生“更智能地”数据库。
工业生物催化主要集中于水解酶,一些酮还原酶(KREDs),以及辅因子再生和在有机溶剂中蛋白质的稳定性研究。
在某些情况下,优化代谢途径;例如,融合不同的自然界菌株的基因于一个新的宿主细胞以产生1,3-丙二醇(形成多聚体的单体),使得将甘油转变为更易被利用的原料葡萄糖成为可能。
由于现在的生物催化浪潮取得的进展,将酶设计成引人瞩目的新功能,例如接受之前的惰性基质(孟鲁司特的KRED或是西他列汀的转氨酶),或是改变形成产物的性质(萜环化酶突变体可作用于不同的萜烯或是氨基酸代谢物使醇类作为生物燃料)。
如今需要新型酶将生物量转换为第二或第三代生物燃料,材料和化学品。
第三大浪潮的主要发展是先进的酶工程(包括定向进化),基因合成,序列分析,生物信息工具和计算机模拟,并且酶改进的理论进展可能比原来预期的要更显著。
工程酶可以在含有60uC的有机溶剂的溶液中保持稳定,可以接受新的底物以及催化新的非天然反应。
目前这一工程可能需要几个月,这样大大扩展潜在的应用。
过去,设计酶化的过程受到酶的限制;目前,酶设计逐渐适应工艺规范。
大约十年前,《Nature》和《Science》的文献综述了第一次和第二次生物催化浪潮,提出了可能带来的第三次浪潮的提示。
现今及时评估第三次浪潮的影响及推测未来十年可能的带来什么进展(框1)。
尽管生物催化涉及到代谢工程和合成生物学,但这些综述重点是针对酶法和全细胞反应。
框1 生物催化应用要求及实例●传统的生物催化,天然产物采用自然反应和途径转变成其他天然产物。
技术要求:尽可能控制自然生物转化;实例:面包和奶酪制作,皮革加工,啤酒和酒发酵,及天然抗生素生成。
●宽底物范围生物催化,化学中间体(非天然产物)通过自然反应和途径转变成其他化学中间体。
技术要求:特定酶的使用(没有干扰活性存在);概念要求:许多酶具有宽的底物范围;实例:采用酯酶和羰基还原酶(乙醇脱氢酶)生产医药中间体。
●多级生物催化,天然产物通过非自然反应和途径转变成燃料,材料和化工原料(非天然产物)。
技术要求:蛋白质工程主要用于稳定性,底物范围和催化反应类型的改变;概念要求:酶可以催化非自然反应,酶的新的组合产生新的途径;实例:用异戊二烯生物合成途径生成燃料分子,氨基酸生物合成燃料乙醇。
适应酶工程的制造工艺为了最大限度降低成本,化工业需要在希望的工艺条件下产生稳定的,选择性的及高产的催化剂。
这样的加工的酶设计先要确定设计目标,例如增加稳定性,可选择性,底物范围,或是通常这些性质的结合。
2000年,第三大浪潮前,只有很少的策略可以满足这些目标。
酶的固定化可以增加蛋白的稳定性,但是稳定性的增加幅度较温和而且往往不能满足大多数化学转化。
定向进化也有可能满足这些目标,但仍然缓慢,因为它需要对大型数据库进行建立和筛选,而且这些数据库中大部分突变体是活性降低甚至没有活性的。
大幅改进的例子很少与产业相关。
低速意味着进化的蛋白仅包含一些变化,因此,酶性质仅稍微得到改变。
尽管几百年来酶法工艺已经应用于工业,但大部分设计的酶和全细胞从遗传学上已被最低限度的改变了。
通过蛋白质工程策略结合自由能(△G)设计目标所需的结构改变这一推理需要利用更集中的数据库。
如果设计目标并非在于开始酶的作用,那么大变化的自由能是必要的。
对蛋白质伸展及反应机理的力学和动力学的理解确定达到设计目标的设计策略。
最终,结构分析(从定性的检测到大量的计算机模拟的差异)可以确定必须改变的区域和氨基酸。
需要高的自由能变化的目标将同样需要结构上更广泛的变化。
过去的十年里,我们对蛋白质和有效地定向进化策略属相的理解都加深,可能酶学性质发生巨大改变。
总的来说,酶工程仍将是通过运用各种解决目前问题可能的方法,对研究成果进行收集,而不是例如用在那些土木,电器,软件或是化学工程的学科的定量的方法。
这些实验研究转化为动力学原理将需要运用自由能与设计目标产物结合成需要的结构变化(图2)。
性质的巨大转变需要自由能的较大转变。
例如,稳定性的明显改变将需要折叠-伸展平衡时更多的自由能变化。
(甚至蛋白质不可逆的伸展起始于一个可逆的部分伸展。
)对蛋白质分子生物学的理解暗示着策略可得到改善。
例如,表面残基促进折叠-伸展平衡,并且在环区增加一个脯氨酸会降低伸展形式的熵。
这些策略代替了随机突变(大部分具有更差的性质)巨大的数据库,而是包含高比例具有活性且潜在的改进的突变体组成的更小的,更集中的蛋白质数据库(图1)。
最后,通过估算各种反应(表面离子对或是增加脯氨酸对熵变的贡献)的强度,研究者可以估算出达到目标所需的变化。
目前很少有研究人员明确的应用基于自由能的方法来计算蛋白质自由能策略,但是将实验研究转变入动力学原理需要一种定量的方法。
新的改进的方法过去的十年里,DNA技术和生物信息学主要进展已经为生物催化领域提供了关键性的支持。
这些工具已经促进了自然资源中新型酶的发现,并且大体上加速了目前生物催化剂的重新设计。
先进的DNA技术新一代的DNA测序技术已可以大规模且相当低成本地进行平行序列的分析。
然而,2002年人类基因组序列分析的成本估计为70,000,000美元,2012年成本已大大降低了1,000倍,低于10,000美元(参考34),Life Technologies 公司,Illumina 公司和Oxford Nanopore Technologies公司已宣布能够在几个小时内对人类全基因组完成测序的测序设备的设计经在2012年晚些推出,这将使每一个基因组的成本降低至少于1,000美元。
不同环境的有机体的全基因组序列,或是环境中的不可培养的有机体(宏基因组)的DNA样本,都已建立了丰富的资源,以供在其中搜索新型生物催化剂[35],而且会继续进行。
运用Illumina技术进行大规模的高通量测序(10,000,000序列读取)也促进了对蛋白质序列-功能关系的探索和了解[36]。
低成本DNA合成已代替基因组DNA的分离成为蛋白质工程的开端。
全基因DNA合成可以进一步为宿主生物体优化密码子,将分子总体结构例如启动子,终止子,增强子,限制性位点等引入到合适的位点。
DNA合成应用传统的亚磷酰胺化学法,但是优化的反应条件已经提高了配对效率,这样增加了聚合物整体质量和数量使得序列可以甚至达到200-250个核苷酸长度。
并行DNA合成应用光刻和喷墨印刷技术进一步降低成本并实现快速合成[37]。
DNA合成也已被用于染色体DNA的整个部分甚至用于代谢途径工程的全基因组的合成[38]。
全基因合成也可被用于合成高质量DNA数据库,范围从小型,集中,饱和位点数据库到大型,综合性的基因库。
自定义的基因甚至基因库正成为类似如今研究实验室使用的试剂和溶剂的商业化化学品。
生物信息学新型工具对实验进展进行补充,生物信息学工具已经成为现代蛋白质工程的一个主要部分[39]。
大的酶家族和同源性搜索的多序列比对中已经确定具有相似催化活性的基因,导致新型的,强有力的生物催化剂[40]。
相同的序列信息可以重建原始的生物催化剂[40],它可能具有更广泛的底物范围和催化多功能性(见下文)。
多序列比对确定每个位点最常见的氨基酸(共有序列)和氨基酸替换以得到功能稳定的酶。
这一数据有助于具有高比例催化活性突变体的小型数据库的设计。
这些数据库已被用于稳定性、催化功能增强及立体选择性改变的生物催化剂的发现[41]。