遗传HEREDITAS (Beijing) 12 (6):35-38 1990大麦醇溶蛋白研究概况湛小燕(中国水稻研究所,杭州310006)本文综合概述了近年来大麦醇溶蛋白(Hordein)的研究情况,涉及醇溶蛋白各组(A,B,C,D)多肤的含量、分子量、等电点,氨基酸组成和序列等生化特性;多肤多态性及形成机制;基因结构、定位及与其他基因(如抗白粉病基因)的连锁关系;进行多肤鉴别的一系列实验方法;蛋白质体和发育中各组醇溶蛋白多肤的积累和差异;高赖氨酸突变体(如RiScp1508, RiS(P56)基因结构及与醇溶蛋白合成的关系等方面。根据Osborne溶解度分类法,大麦胚乳蛋白可分成清蛋白(albumin)、球蛋白(globulins),醇溶蛋白(ho rdein)和谷蛋白(glutelin)。其中醇溶蛋白占总蛋白的40-60%,是种子蛋白的重要组成部分。然而无论从必需氨基酸含量还是从氨基酸平衡看,醇溶蛋白都不理想,致使大麦营养价值偏低,影响人畜利用。因而长期以来,人们对醇溶蛋白进行了多方面的研究,包括蛋白的组成、结构及利用多态性进行品种鉴定,基因定位和遗传,蛋白质体和发育中醇溶蛋白积累,高赖氨酸突变体及与醇溶蛋白的关系等。国外研究较活跃,尤其是英国、美国和丹麦;我国起步较晚,报道不多。一、醉溶蛋白的组成、结构和多态性大麦醇溶蛋白据氨基酸组成、分子量等分为A, B,C, D 4组。A组,占总醇溶蛋白含量的1--2%,分子量20000道尔顿以下,等电点p15.5-7 .0,含有比B, C组多肚明显低的谷氨酞胺、脯氨酸和相对高的赖氨酸,表现出很小或几乎没有遗传变异,并且很有可能不存在于蛋白质体[311,因此一般倾向于认为A组多肤不是醇溶蛋白。B组是大麦醇溶蛋白的重要组成之一,占总醇溶蛋白的70-90%1'1。分子量据不同测定方法有所不一,用电泳法为35000-46000道尔顿,用平衡超速离心为32000-35000道尔顿。等电点P16.0-8. 0,富含谷氨酞胺、谷氨酸(Gln+Glu 35.4摩尔百分数)、脯氨酸(20.6摩尔百分数),但比C组醇溶蛋白略低一筹;必需氨基酸和碱性氨基酸缺乏;较特殊的是相对富有含硫氨基酸(半耽氨酸2.5摩尔百分数),致使B组多肤部分以单体,部分通过二硫键以聚合体形式存在于生物体。关于B醇溶蛋白末端氨基酸的研究远落后于对C醇溶蛋白的研究。曾有人用矮肤酶双ca rbcxypeptidase Y)水解C-端,检侧释放的氨基酸并据量与时间关系推知B,醇溶蛋白可能的序列为一G坛-Val-000H, B的N-端氨基酸分析由于不能进行埃德曼降解(Edman degradation)而难以进行,未见报道.C组,占总醇溶蛋白的10-30%,分子量5500。一75000道尔顿(SDS一PAGE)或52000道尔顿(平衡超速离心),等电点pI5.0-6.0。富含谷氨酚胺、谷氨酸(Gln+Glu 40摩尔百分数)、脯氨酸(30摩尔百分数),缺乏必需氨基酸和酸或碱性氨基酸,赖氨酸和蛋氨酸含量比B醇溶蛋白还低,平均每条多肤链仅1个赖氨酸残基。与B不同的是没有或痕量半肤氨酸,多肤一般以单体形式存在;但也有人〔13’认为C组各多肤可能相互或与其他醇溶蛋白多肤以氢键或疏水作用而聚合,这种聚合在提取过程中被破坏了。C组内各多肤有较高的结构同源性〔”’,N-端30个残基仅1个有替代,12个残基后是3个重复序列(pro/Lou-Gln-Gln-pro-Tyr)o 2个随机糜蛋白酶切序列是八肤(pro-Gln-Gln-pro-phe-pro-G1n-Gln)。由于苯丙氨酸可替代酩氨酸,这八肤可能是5肤加3队。另有人‘川以RisO 56测定的N-端序列为Zhan Xiaoyan: AHordein of Barley本文于1989年5月Survey for the Research of27日收到。综迷PQNpyf1(a...... f表示预测的9-折叠)用拨肤酶Y水解法测定C-端,认为C,多肤可能有2类,即一Val一Ser-000H和一Lle-Met-000H。关于C醇溶蛋白二级结构,不少人认为〔.,‘书,”’是R-折叠。没有“一螺旋和(3-片层,是由于脯氨酸的存在,在N-端,每隔2,3,4个残基就出现1次脯氨酸,而形成。-螺旋或R-片层的最小残基数分别为5,60D组,占总醇溶蛋白的2-4%,分子量100 000以上,P18.0左右,含有较多甘氨酸。品种间变异很小,单向电泳仅具一条带,但双向电泳或其他高分辨率方法表明它包含了若干等电点不同的多肤,并可能以聚合的形式存在于生物体。众多证据表明〔z41 B和C组醇溶蛋白有极明显的多态性,多肤数B至少三四十个,C至少一二十个,每种多肤在品种和地理上的分布有差异,同一组内各多肤分子量、等电点等不同,却有相似的氨基酸组成和末端氨基酸序列〔川。对这些现象目前一般认为编码B,C醇溶蛋白的Hor2, Horl位点是多基因簇,由一原给基因经重复、趋异形成的紧密连锁基因群E4,91。由于醇溶蛋白不承担重要生理功能,可以忍受较多突变,故有明显的多态性。点突变、缺失和/或插入可能对多态性起作用,除了造成等电点和溟化氰断裂型改变,后者通过不对等交换或对错误配对DNA的修正,改变了多肤分子量。这些趋异途径也可解释同组多肤有不同的等电点和分子量却有相似的末端氨基酸序列。有研究表明组内各多肤在序列同源程度上表现出差异,这可能暗示重复、趋异是在长时期内分几次发生的。可能由于检测方法限制和等位基因剂量效应干扰,Hor 1,Hor2, Hor3位点内部未见重组报道,而这种重组在决定不同多肤在现代大麦系列中的分布可能起到了重要作用。二、醇溶蛋白基因定位及遗传醇溶蛋白各组多肤基因及定位长期以来颇受重视。一致认为Hor 1, Hor 2, Hor 3位于第5染色体。较完整连锁图是Jensen"'3和Shewryr3=〕提出的(图1)0、短臂、长臂Hor 1 C醇溶蛋白Hor 2 B醇溶蛋白月or 3 D醇溶蛋白图1大麦第5染色体部分基因连锁图Rps4 (Yr4)抗黄锈病1共显性A里In俘召抗白粉病黑果皮显性necl叶上坏死点rusts幼叶白条斑了s2脆茎隐性二者结果基本相似,但Horl-Rps4间图距相去甚远,分别为1.5cm和15.9cm,原因不明。Shewry认为Min,与Hor3, Horl, Rps不连锁,但Jensen以为Min。与二。1间有松散连锁(36.8 f 4.2);现有倾向认为Min。可能并不真正位于第,染色休,有待进一步证明。另据报道E301,抗白粉病基因Mia, Mll。与Horl, Hor2连锁。Horl, Hor2间距0.161+0.026cm, M1a位于之间,跟Hor 1, Hor 2间距0.064士0.020和0.082 f 0.024cmo Horl, Hor2和Mla,Mlle的紧密联锁,客观上造成某些抗白粉病基因与特定醇榕蛋白等位基因联合,在一些情况下,育种中引进抗白粉基因,同时也就把某些醇溶蛋白等位基因引进来。这一连锁,意味着醇溶蛋白分析可作为抗白粉病育种的初级检测C2670从杂交子二代分离看,Horl, Hor 2,Hor 3均为1:2:1 (P>0.05),表明是共显性遗传。比较大麦醇溶蛋白基因位置与相应基因在小麦上的位置是很有意义的(图2)。小麦高分子量型蛋白丈HMW)由等位基因Glu 1编码,位于第1同源染色体长臂,距着丝粒9cmr231。大麦第5染色体着丝粒可能位于fs2的短臂端,这样,Hor3距着丝粒大约也是9cm。小麦w一型醇溶蛋白与c组同源,由Gli 1编码,在第1染色体短臂,距Glul 66cm,与Horl和Hor3短臂长肴GliGlr.小麦第I同源桑色体(1B染色体)小麦第5染色体Hor2 HorlHor3图2醇溶蛋白基因在大、小麦染色体上位置比较的间距(64.8士3.3cm)很接近。小麦r一型醇溶蛋白与B组多眯氨基酸组成相似,由Gli 1编码;这样,小麦Gli 1可能对应于大麦的Hor 1和Hor 2。小麦醇溶蛋白基因Gli 2在第6同源染色体短臂「”,,,,。三、利用醇溶蛋白多态性进行品种鉴定不同种与品种醇溶蛋白并不完全相同,构成了差异。由于多肤是基因产物,因而特征多肤是相对稳定的;虽然环境因子可影响蛋白含量,但特征多肤的有无全然不受影响,这样,醇溶蛋白就成为品种的标记或“指纹”,)一与泛应用于品种或种的鉴定。分离各醇溶蛋白多肤的方法有电泳,包括早期使用的淀粉凝胶电泳(SGE),尿素一聚丙烯酞胺凝胶电泳(urea-PAGE)和目前广为使用的十二烷基磺酸钠一聚丙烯酚胺凝胶电泳(SDS-PAGE),等电聚焦凝胶电泳(IEF)及双向电泳。随着生物技术的不断更新,目前多采用高效液相柱层析,其中用得最多的是反向高效液相柱层析(RP-HPLC),不仅加快了分析速度,结果还可自动分类,鉴别出一些电泳无法甄别的相似品种〔eto Bategt'3提出的离子交换柱层析也可快速而精确地分离多肤,而所需设备比较简单,Deichl和Donhausertt0,rz]发展了定量免疫法,即以醇溶蛋白多肤为抗原的抗原抗体反应,可以定量,检测到一些不易区分的品种;并且构建的单克隆抗体有可能允许在短时间内检测大量样品。如果说上述方法是以多肤为目标,那么Burr和Rivint5,',z'3提出的方法是直接对准了基因。他们以醇溶蛋白基因DNA限制性酶切片段长度的多态性(restriction fragment length polymorphism RFLP's)为指纹,即以DNA限制性核酸内切酶(Hind III和Eco R1)酶切Hor 1, Hor 2, Hor 3,再通过吸印转移法(Southern blot),用C, B, D醇溶蛋白cDNA克隆与酶切片段杂交,差异表现为杂交片段数目和/或电泳迁移率不同,达到鉴定目的。四、蛋白质体和发育中醇溶蛋白积累虽然一直认为醇溶蛋白和球蛋白沉积于蛋白质体,但细节不清。至1981年,Miflintz”指出:大麦醇溶蛋白在粗糙内质网合成并聚集成团,然后从内质网破出,形成不规则沉淀体(蛋白质体),其表面没有完整的膜,但有许多小泡,并与粗糙内质网仍有粘连。据Rahmantz=’观察,大麦受精后胚乳发育远比胚早,14天胚乳液状体,18天电泳检测不到特征带型,但此后醇溶蛋白合成迅速增加,20天胚乳达干重的40%,可见电泳带型,22天胚乳已达干重的“%。在发育过程中,幼小胚乳时C达到高峰,约占总醇溶蛋白的20%,但渐减至26天的14%,并稳定下来;相应观察到B:的增加,从幼小组织的30%到成熟种子的50%。由此可见,Hor 2,Hor 1的表达是有差异的「“’。另外,若硫成为限制因子,也将导致B, C比例的改变,因为合成B醇溶蛋白需要含硫氨基酸,而C组多肤几乎不含半胧氨酸,籽拉发育过程中A的相对量也渐减。值得注意的是组内各多肤积累速率也有差异,如B组,B1相对增加,而这种增加不可能是其他B组分转化造成的。因为一方面从澳化氰切带型看,B1有二个高等电点多肤,它们与B2,B3的多肤明显不同;另一方面,检测到mRNA的变化与之吻合‘”’产DNA克隆杂交也证明之。这意味着同一复合基因簇的表达有所不同,而这一基因簇很可能受律动调节(c。一ordinated regulation)的。但也有人认为这是由于mRNA稳定性不同造成的。五、大麦高赖氨酸突变体及其与醇溶蛋白的关系最初,人们在玉米中发现了高赖氨酸突变体,随后,在大麦、高粱等作物中也陆续有了发现。大麦有18种突变体或系列,其中部分进行了遗传分析和基因定位,主要涉及的染色体有第1,5,6,7号。Ris(1508的醇溶蛋白量比亲本(Bomi)明显减少〔19,341,有证据表明这并非合成起始晚,而是合成的抑制或减少;电泳带型也发生了变化〔”。清蛋白含量显著增加。Ris( 1508高赖氨酸基因lys 3a位于第7染色体,在调节醇溶蛋白合成时对不同组多肤有不同效应,分别为:D不受影响;C几乎完全抑制,对BI影响较大,对B3有影响但小于前者。在相关的mRNA上也看到了这种表象6值得注意的是Ris中1508中并未发现Hor 2位点的严重缺失(对比Ri呻56)o B1和B3的相对比例也受另二个突变基因的影响,它们是Ris( 13第6染色体上的lys5f和Ris( 7的未定位高赖氨酸突变基因。所有这些突变基因可以认为是调节者,可位于也可不位于第5染色体。这些基因可能还存在多效效应(pleiotropic effects).