6 蛋白质工程学习目的:①初步了解蛋白质结构、以及蛋白质分子设计和蛋白质修饰和表达等的基本原理。
②了解如何利用蛋白质工程技术和其他相关技术获得更加符合人类需求且比天然蛋白质更优良的蛋白质,20世纪60年代初,随着生物化学和分子生物学的发展和延伸,人们对生物的遗传物质——DNA结构与功能已经有了比较清楚的认识。
1972年,美国斯坦福大学Berg成功地实现了DNA重组实验,从此揭开了基因工程发展的序幕,并逐步形成了以基因工程为核心内容,包括细胞工程、酶工程、发酵工程在内的一系列高新生物技术。
这些技术发展到今天,已经形成产业化并成为全球高科技领域发展的主流,广泛地应用于食品、医药、化工、农业、环保、能源、资源再利用和国防等许多部门与行业,并日益显示出不可估量的社会效益和经济效益,将为解决当前世界所面临的蛋白质缺乏、能源不足和高效医药品短缺等系列重大问题提供了基本保证和可行性技术。
20世纪80年代初,随着蛋白质晶体学和结构生物学的发展,人类可以通过对蛋白质结构与功能的了解,借助计算机辅助设计,利用基因定位诱变等高新技术改造基因,以达到改进蛋白质某些性质的目的。
这些技术的融合,促使了蛋白质工程这一新兴生物技术领域的诞生,为认识和改造蛋白质分子提供了强有力的手段。
1982年,Winter等首次报道了通过基因定位诱变获得改性的酪氨酸 tRNA合成酶;1983年,Ulmer 在《科学》杂志上发表了以"Protein Engineering"(蛋白质工程)为题的专论,这标志着人们能按自己的意愿创造出适合人类需求的新基因,并能表达出具有不同功能的蛋白质。
这是新一代的基因工程,因而蛋白质工程也被称为第二代基因工程。
蛋白质工程的基本内容和目的可以概括为:以蛋白质结构与功能为基础,通过化学和物理手段,对目标基因按预期设计进行修饰和改造,合成新的蛋白质;对现有的蛋白质加以定向改造、设计、构建和最终生产出比自然界存在的蛋白质功能更优良,更符合人类需求的功能蛋白质。
6.1 蛋白质结构基础.6.1.1 蛋白质结构的基本构件在自然界中,构成生命最基本的物质有蛋白质、核算、多糖和脂类等生物大分产,其中蛋白质最为重要,核酸则最为根本。
各种生物功能、生命现象和生理活动主往是通过蛋白质来实现的,因此蛋白质不仅是生物体的主要组分,更重要的是它与生命活动有着十分密切的关系。
在体内,蛋白质执行着酶催化作用,使新陈代谢能有序地进行,从而表现出各种生命的现象;通过激素的调节代谢作用,以确保动囱正常的生理活动;产生相应的抗体蛋白,使人和动物具有防御疾病和抵抗外界病原侵袭的免疫能力;构建成的各种生物膜,形成生物体内物质和信息交流的通路和能量转换的场所。
这一系列功能充分说明了蛋白质在生命活动中的重要作用,说明生命活动是不能离开蛋白质而存在的。
6.1.1.1 蛋白质的化学组成蛋白质在生命活动过程中之所以有如此重要作用,是由它自身的组成、结构、性质所决定的。
从动、植物细胞中提取出来的各种蛋白质,经元素分析,均含有碳、氢、氧、氮及少量的硫元素。
这些元素在蛋白质中多以大致一定的比例存在。
有些蛋白质还含有微量的过渡金属元素,例如:铁、锌、钼和镍等元素。
蛋白质经干燥后,其元素组成平均值约为:碳 50%~55%氢6.0%~7.0%氧 20%~23%氮 15%~17%硫0.3%~2.5%通常蛋白质的分子质量均在一万道尔顿以上,变化范围从10000到1 000000道尔顿,结构很复杂。
蛋白质易被酸、碱和蛋白酶催化水解成分子量大小不等的肽段和氨基酸,这一过程所获得的产物称为不完全水解或部分水解产物。
两个或两个以上氨基酸残基组成的片段称为肽。
生产上常把蛋白质不完全水解的产物按分子大小分别称为脉、胨、肽。
其实脉和胨仅用于表示分子量较大但不确定的多肽混合物。
短肽可以进一步被水解成氨基酸,并成为蛋白质水解的最小单位,是组成蛋白质的基本单位。
从蛋白质水解物中分离出来的氨基酸有20种。
除了脯氨酸外,所有的氨基酸均可用下式表示:R(NH2一CH--COOH)其中R代表侧链基团,不同氨基酸,R基团不同。
生物化学中,氨基酸的名称一般使用三字母的简写符号表示,有时也用单字母的简写符号表示。
这两套简写符号见于表6-1。
如按照。
a—氨基酸(a—氨基酸是指氨基处于与羧基相连的碳原子上)中侧链R基的极性性质,组成蛋白质的20种常见的氨基酸可分为以下四组:①非极性R基氨基酸,这一组中共有八种氨基酸,其中五种是带有脂肪烃的氨基酸,即丙氨酸、亮氨酸、异亮氨酸、缬氨酸和脯氨酸;两种芳香族氨基酸,即苯丙氨酸和色氨酸;一种含硫氨基酸,即甲硫氨酸(蛋氨酸)。
②不带电荷的极性R基氨基酸,这一组中有七种氨基酸,即甘氨酸、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、天冬酰胺和谷氨酰胺。
③带正电荷的R基氨基酸,这一组氨基酸属于碱性氨基酸,即赖氨酸、精氨酸和组氨酸,在pH=7.0时,表现出正电荷特性。
④带负电荷的R基的酸性氨基酸有两种,即天冬氨酸和谷氨酸。
这两种氨基酸均含有两个羧基,在pH6~7范围内完全解离,因而表现出负电荷特性。
在蛋白质组成中,除了上述凹种常见的氨基酸外,从少数蛋白质中还分离出一些a-氨基酸,如二碘酪氨酸、甲状腺素、羟脯氨酸等。
6.1.1.2 氨基酸的物理性质o-氨基酸呈五色结晶,各有特殊晶型。
它们的熔点极高,一般在200~300℃左右。
氨基酸是以两性离子形式存在的。
由于各种氨基酸都具有特定的熔点,常用于定性鉴定。
由于氨基酸分子上含有氨基和羧基,它既可接受质子,又可以释放质子,因此氨基酸属于两性电解质物质。
每一种氨基酸都具有特定的等电点(p1),如亮氨酸的pI为5.98,精氨酸为10.76,赖氨酸为9.74等。
各种氨基酸的等电点不同起因在于各种氨基酸分子上所含氨基、羧基等基团以及各种基团的解离程度不同所致的。
当溶液的pH小于某氨基酸的等电点时,则该氨基酸带正电荷,若溶液中pH大于某氨基酸的等电点时,则该氨基酸带负电荷。
因此,在同一PH条件下,各种氨基酸所带的电荷不同。
根据这一性质,就可以通过调节溶液的pH,使混合液中的各种氨基酸带上不同的电荷,再选用离子交换层析法或高压凝胶电泳技术把这些氨基酸混合物一一分开。
目前常用于分离混合氨基酸技术有纸上层析法、离子交换法、薄层层析法、高压液相色谱法、高压凝胶电泳法和毛细管电泳法等。
6。
1.1.3 蛋白质的一级结构蛋白质是由许多氨基酸按一定的排列顺序通过肽键相连而成的多肽链。
蛋白质的肽链结构成为蛋白质的化学结构,它包括氨基酸组成、肽链数目、末端组成、氨基酸排列顺序和二硫键位置等内容。
一个氨基酸的氨基与另一氨基酸的羧基缩合失去一分子水,形成酰胺键,这种氨基酸之间连接的酰胺键又称为肽键,一般由三个或三个以上的氨基酸残基组成的肽称为多肽。
下面为蛋白质中一段多肽链的模式结构,表示氨基酸之间的肽键(图6—1)。
通常书写多肽或蛋白质肽链结构时,总是把含有游离a-NH2的氨基酸一端写在左边,称为N端,用“H”表示;把含游离的 a-COOH的氨基酸一端写在右边,称为C端,用“OH”表示。
在自然界中,多数蛋白质分子并不是由简单的单条肽链组成,即使是由单链组成,也存在分支或成环状现象。
一般情况下,一个蛋白质分子中的肽链的数目应等于末端氨基残基的数目。
因此可根据末端残基的数目来确定一种蛋白质分子是由几条肽链构成。
如果已知某种蛋白质含有几条肽链,则必须设法先分开这些肽链,然后再测定每条肽链的氨基酸序列。
胰岛素分子由两条多肽链组成,分别称为A链和B链,两条肽链由两个二硫键连接起来,在A链内部还有一个二硫键,它将A链的第6和第11氨基酸残基连接起来。
A链和B链分别由21个和30个氨基酸残基组成(图6-2)。
从图中可看出,人与猪和牛的胰岛素组成存在着1~2个氨基酸残基的差异,如用后两种动物的胰岛素治疗人的糖尿病时,其药效比直接采用人胰岛素低。
这一现象说明了,每一种蛋白质的功能与它的肽链氨基酸序列和肽链构成的高级结构有着不可分割的联系。
从上述胰岛素分子结构可知蛋白质一级结构就是由许多氨基酸按照一定的排列顺序,通过肽键相连接而成的多肽链结构,每一种蛋白质的肽链的氨基酸都有一定的排列顺序。
蛋白质的一级结构是最基本的,它包含着决定蛋白质的高级结构的关键性因素。
6.1.2 蛋白质的高级结构蛋白质的分子结构可划分为一级结构、二级结构、三级结构和四级结构,这些结构由各种化学键组成。
蛋白质的分子构象又称为空间结构、高级结构、立体结构、三维结构等等,是指蛋白质分子中所有原子在三维空间中的摆布情况和规律。
图6—2 猪、牛和人胰岛素一级结构所谓蛋白质的二级结构是指多肽链主链骨架中的若干肽段,各自沿着某个轴盘旋或折叠,并以氢键维系,从而形成有规则的构象,如a—螺旋,β -折叠和β—转角等。
a—螺旋和β—折叠是蛋白质构象的重要单元。
二级结构不涉及氨基酸残基的侧链构象。
Paldi和Corny(1951年)用X—射线衍射技术研究多肽链的结构时,发现其中存在a—螺旋,肽链折叠成螺旋形状。
a—螺旋的螺距(pitch)5.4Å,螺旋每绕一圈 (360°)为3.8个氨基酸残基,每个重复单位沿螺旋轴上升1.5 Å (图6—3)。
β—折叠是一种肽链相对伸展的结构(图64)。
在这种结构模型中,肽链按层排列,在相邻的肽链之间形成氢键,得以巩固这种结构。
肽链的走向有正平行式和反平行式,正平行式即所有肽链的N末端都在同一端,如β-角蛋白。
反平行式即肽链的N端一顺一倒地排列,如丝心蛋白。
从能量角度考虑,反平行式更为稳定。
在天然蛋白质变性时,往往就包含a—螺旋向β-折叠的转变。
在自然界中,多数蛋白质的空间结构呈球状,它比纤维型蛋白质的结构要复杂得多。
球状蛋白不是简单地沿着一个轴有规律地重复排列,而是在三维空间中沿着多方向进行卷曲、折叠、盘绕而成的近似球形的结构。
这种在二级结构基础上的肽链再折叠,称为蛋白质的三级结构。
维持蛋白质构象的作用力有四种非共价键类型:①R基之间的氢键;②非极性R 基之间的疏水基相互作用(范德华引力);③ a-螺旋和β—折叠中的肽链内或肽链间的氢键;④带正负电荷的R基之间的离子键。
维持蛋白质的三级结构最重要的作用力是疏水键的相互作用。
从共价结构上看,亚基就是蛋白质分子的最小共价单位。
亚基一般是由一条多肽链组成的,但有的亚基也可以由几条多肽链组成,这些多肽链通常以二硫键相连接成为亚基。
由亚基聚合而成的蛋白质分子称为寡聚蛋白。
由亚基组成的寡聚蛋白结构被称为四级结构,侧重强调亚基之间的相互作用和空间排布情况。
由相同的亚基构成的四级结构,叫均一四级结构;由不同亚基组成的四级结构,叫非均一四级结构。
四级结构不是靠共价键结合的,维持四级结构的主要力靠疏水键,氢键、离子键和范德华引力也参与维持四级结构的稳定性,但是它们可能仅仅起到次要的作用。