生物大分子结构与功能——蛋白质折叠蛋白质折叠是生物化学和分子生物学的前沿课题之一,近年来蛋白质折叠的研究日益引起人们注意的原因是多方面的。
其一,遗传信息由DNA 到RNA再到蛋白质的过程是分子生物学的核心,通常称作分子生物学的中心法则,经过多年的研究人们对由DNA到RNA再到多肽链的过程已基本清楚,但是蛋白质的功能不仅依赖于其一级结构而且与空间结构紧密相关;其二,虽然蛋白质中一定的氨基酸顺序决定了其特定的空间结构的假说已被人们广泛接受,但是怎样由一定的氨基酸排列的多肽链生成具有一定的空间结构的蛋白质的问题仍未解决。
只有透彻地了解了多肽链是如何通过自身内在的信息及与周围环境(包括与各种蛋白质因子)的相互作用才能最终了解蛋白质的空间结构与功能的关系。
基因工程和蛋白质工程是近年来生物技术发展的产物和先导,但人们发现通过基因工程和蛋白质工程所获得的多肽链有时并不能自身卷曲成有一定空间结构和完整生物学功能的蛋白质,其原因在于在多肽链的折叠上出了问题。
因此从基因工程和蛋白质工程产物的翻译后加工的角度也要求人们了解蛋白质折叠的机理。
一、蛋白质复杂的三级结构信息贮存于氨基酸序列中关于氨基酸序列与蛋白质空间结构的关系研究最早的工作是由C.Anfinsen (1960)关于核糖核酸酶的研究工作。
他研究了核糖核酸酶的去折叠和重折叠过程。
该酶是由124 个氨基酸组成的蛋白质,有四对二硫键,其组合有105{[(2×4)!/24×4!]=105}种的可能方式。
当用还原剂如b-巯基乙醇(HOCH2-CH2-SH)作用时,二硫键被部分还原。
继续加大b-巯基乙醇的量,二硫键可全部被还原。
用8 M 的脲加b-巯基乙醇处理多肽链,分子内四对二硫键可全部被还原,肽链伸展为无规卷曲,酶活性完全丧失。
但如果将脲和b-巯基乙醇透析掉并在空气中进行氧化,多肽链可又重新折叠为一个具有特定的三维结构和催化活性的酶,它与未经处理的酶具有相同的溶解度并可结晶并获得相同的X-射线衍射图,其吸收光谱也相同。
这是一个很好的蛋白质一级结构序列决定其三维结构的例子,即顺序决定构象。
Anfinsen因此而获得1972年诺贝尔化学奖。
二、关于蛋白质折叠的理论模型各种实验及理论计算均证明蛋白质的天然构象在热力学上是最稳定的。
那么一个具有特定的生物学活性和功能的蛋白质究竟是如何找到这样一种热力学稳定的构象的呢?这至今仍是一个未解决的问题。
我们可以以一个由100 个氨基酸组成的小蛋白质来进行讨论和考虑:假设在这100 个氨基酸组成的小蛋白质中每个氨基酸残基有三种不同的构象的话,那么总的构象数将是3100=5×1047 ,如果从一种构象变为另一种构象所需要的时间为10-13秒,那么在上述的构象空间寻求一遍需要5×1047×10-13=5×1034秒=1.6×1027 年!而实际上蛋白质的折叠是在10-1~10 3秒内完成的。
由此可见,蛋白质的折叠不是一个对各种可能构象进行随机采样的过程。
关于蛋白质的折叠人们提出了各种的折叠模型其主要有:1. 框架模型(Framework model):P. S. Kim 和R. L. Baldwin 于1982 年提出了蛋白质折叠的框架模型,该模型认为在蛋白质折叠的过程中大约有15个氨基酸残基的多肽链首先折叠为瞬态的a螺旋或b片层结构的二级结构单元,然后这种瞬态的结构通过扩散彼此接近形成aa、ab 或bb的复合结构而获得稳定。
这种复合结构又称为折叠单元。
折叠单元作为一个核心吸引和稳定其它摆动着的二级结构单元,形成折叠框架,其它的侧链将适应这个框架。
2. 疏水折叠模型(Hydrophobic Collapse Model)和熔融球态模型(Molten Globule Model):该模型提出折叠是由疏水折叠开始的,即四体石蜡的疏水片段首先聚集在一起,然后进一步聚集长大,形成一种称为熔融球蛋白中间体。
此种结构是一种具有二级结构但很少有三级相互作用的结构,疏水残基有很大一部分暴露在溶剂中。
三、蛋白质的去折叠(unfolding)和重折叠(refolding)蛋白质的去折叠和重折叠亦即蛋白质的变性和复性。
蛋白质的折叠状态只有在最适条件下才可存在。
环境的改变,诸如温度、pH、变性剂、压力等作用都可使蛋白质的结构被破坏。
变性的物理基础是:pH的改变可使盐键断裂,使埋藏在蛋白质结构内部的非解离基团得到裂解而暴露出来,蛋白质去折叠以减少静电相互作用;变性剂如脲和盐酸胍等可使蛋白质结构中的氢键发生断裂,这增加了非极性分子包括氨基酸侧链的溶解度,减少了疏水相互作用;脲还可以深入到蛋白质分子的内部影响蛋白质分子的密堆积。
此外,去污剂、有机溶剂、重金属、热、机械力、冷冻、超声、高压、辐射等均可引起蛋白质的变性。
这些变性均不会破坏蛋白质的共价键而是只涉及到氢键、盐键、疏水相互作用、范得华相互作用等次级键的破坏。
有些变性的蛋白质当变性因素被除去后又可自动地恢复到天然状态,这种现象称为蛋白质的复性(renaturation),这种复性即蛋白质折叠研究中的重折叠(refolding)。
(1931年吴宪提出的蛋白质变性学说)长期以来关于蛋白质的去折叠与折叠流行着一种二态模型。
即认为在蛋白质变性过程中次级键之间存在着一种协同作用,当变性因素增强时最初并不能观察到蛋白质分子的结构有何变化,而当达到某一阈值时由于某些关键性的次级键的变化而导致蛋白质构象的急剧变化。
二态模型可表示为U、N相互转化的模式, U 代表伸展态,N 代表天然态。
二态模型认为从伸展态到天然态的过程或反之过程是一个完全协调的过程,没有可观察到的中间态。
但近年来Baldwin 等人的研究发现,以上的二态模型需要进行修正。
他们利用重氢交换快速混合技术以及二维核磁波谱技术等有效地捕获了结构稳定的折叠中间产物。
具体做法如下:1 将蛋白质溶于含4.2M GuHCl 的pD值为6.0的重水中,此时蛋白质多肽链完全伸展所有质子都被氘代;2 加入0.1M 醋酸水溶液稀释使pH 值达6.2,此时蛋白质开始重折叠。
,加入pH 值为9.3 的缓冲液,使所有溶剂可接近的质子在1ms3 经过时间tf的时间内与氘交换。
4 降低pH值使交换中止,再折叠过程完成。
利用二维核磁共振技术,分辨哪些残基被氘交换并形成了什么样的结构。
通过改变t可以确定哪些部分先于其它部分折叠,还可揭示不同中间体形成的f顺序。
例如,利用此技术他们证明了细胞色素C 折叠的第一步为多肽链链两端的两个螺旋先形成,而核糖核酸酶的折叠则是分子中部的b折叠片形成最早等。
四、蛋白质折叠的热力学近年来人们对蛋白质的热力学性质越来越加以重视,其原因在于人们认识到蛋白质是一个由成千上万个原子组成的宏观体系,它既有序又缺乏对称性。
对它的了解象对其它热力学体系一样,仅了解它的结构是远远不够的,必须了解它们的热力学性质。
蛋白质结构的稳定性可用蛋白质的去折叠过程的自由能来表示,如以N表示天然构象,以D 表示伸展构象,则:N 、D之间处于动态平衡。
天然态和伸展态之间有自由能之差ΔGΔG= G D-G N由各种计算方法,人们可以计算在天然态和变性态的热量和定压热容、D>N 的数值、与溶剂的接触、有序度等,可通过这些计算结果作出一系列的氢键断裂、折叠程度、温度与有序度。
以及在某一温度下与溶剂接触的影响等曲线,从而研究某一具体的蛋白质的折叠稳定性及其与周围环境的关系等。
近来对于解释蛋白质是如何快速的形成能量最低状态即天然状态,一个被广泛接受的模型是“漏斗模型”,即在一个漏斗状的能量表面上,蛋白可能通过一系列不同的路径进行折叠。
这里有一篇相关文献:下载。
五、蛋白质折叠的识别近年来已经报道了用一些新方法成功地由氨基酸顺序信息预测了它们的折叠构象。
为了提供蛋白质结构预测的标准,1994 年来自世界各地的35个实验室的约150 名科学家在美国加州的Asilomar 开会对33 个蛋白质结构的预测问题进行总结。
这些要进行结构预测的蛋白质从已知折叠和结构的蛋白到未知结构的新蛋白,每个实验室要进行诸如蛋白质的结构类型、二级结构和原子坐标(三级结构)等的预测。
在分配给各实验室进行结构预测时根据不同的情况向每个实验室提供诸如蛋白质名称、氨基酸顺序、晶体学家的建议和该蛋白的参考文献等。
利用这些信息加上蛋白质结构的各种数据库,有的实验室的目标是根据同源蛋白的结构建立详细的三维结构模型;有的实验室则只需进行二级结构的预测等。
所有这些预测的结果至少在会议前的一个月提交。
由会议的结果获得了有关蛋白质折叠的识别问题,即将一个新的顺序与一个已知的特征化的三维结构花样的叠合识别在大多数情况下是比较成功的,在某些情况下是相当可靠的,尤其是当两个蛋白具有相同的重要氨基酸顺序时,它们总是在那些区域具有相同的三维结构。
对于两个同源蛋白的折叠识别就如同找出这两个蛋白一个未知蛋白[Test Protein]和一个已知蛋白[Template Protein] 的氨基酸间的最佳对齐一样简单。
当两个蛋白间的氨基酸顺序相同性降低时,不论氨基酸残基间的相似性如何,这些氨基酸残基仍占据在等效的位置。
例如在未知蛋白中的一个异亮氨酸(Ile)取代已知蛋白中的缬氨酸(Val),这两个蛋白的折叠仍然是相同的。
虽然在蛋白质三维结构的相同位置上如果一个精氨酸取代缬氨酸会影响折叠,但如果缬氨酸暴露于蛋白质的分子表面的话,则这种取代也不会对折叠有多大影响。
实际上所需要的只是估计出没有同源性的两个蛋白之间的顺序相似性以估计出已知蛋白中的每个位置上的可允许的取代并加上插入和缺失。
六、蛋白质折叠识别的方式人们发现折叠识别的方式之一是通过比较,从进化分叉机理上紧密相关蛋白的家族列出一个直接了当的取代/插入/缺失(sub-in-del)的表,然后进行对齐比较,这种对齐直接表示了在一致性顺序(consensus sequence) 中每个位置的功能容忍性与由进化所产生的顺序变化之间的关系。
如果蛋白家族相对于氨基酸顺序的变化占主导地位,则基本可推断出其所有成员的结构特性,并推测出其折叠的共有特征。
此外从取代/插入/缺失(sub-in-del)表中的多重对齐顺序可识别出可容忍的插入/缺失片断(环和非结构连接片断)和那些不能容忍的插入/缺失片断(a 螺旋和b链),再加上可识别的b链a螺旋和暴露于溶剂区的片断。
基于这样的一致性模型的结果加州大学旧金山分校的Fred Cohen 举出了五种或更多的同源蛋白的家族在没有晶体结构的情况下根据二级结构和环的预测方式,推测出了它们的结构。
例如,他们把丙酮酸磷酸二激酶(pyruvate phosphate dikinase)的第四个结构域(domain 4)正确地定位于具有a/b TIM 桶花样的蛋白类型中;另外有其它的几个组也正确地预测了Chorismate Mutase (变位酶)是一个a结构的蛋白,还有一个组预测出该蛋白的两个相同亚基是通过a-coiled-coil 的方式作为二体间相互作用的。