课程论文题目:狂犬病毒ABLV编码核蛋白(N)的生物信息学分析课程名称:生物信息学姓名:秦鸽鸽学号: Y4学院:生命科学与工程学院专业:基础兽医学狂犬病毒ABLV编码核蛋白(N)的生物信息学分析摘要:狂犬病病毒(rabies virus,RV)是引起中枢神经系统感染的急性人畜共患传染病。
狂犬病病毒基因组是由单股负链、不分节段的RNA组成。
基因组编码病毒的核蛋白(N)、磷酸化蛋白(NS)、基质蛋白(M)、糖蛋白(G)和依赖RNA 的RNA 多聚酶(L)5 个主要结构蛋白。
N蛋白是组成的主要,是诱导细胞免疫的主要成分,常用于的诊断、分类和流行病学研究。
本文就核蛋白(N)的理化性质、蛋白质结构、系统进化关系等进行了预测和分析,预测结果表明核蛋白的一级结构稳定,为亲水性蛋白,有两个跨膜区,ABLV病毒与其它6个基因型的病毒亲缘关系较其他病毒近,但之间又有明显的距离。
关键字狂犬病毒;核蛋白;理化性质;蛋白质结构预测;系统进化分析狂犬病病毒在野生动物(狼、狐狸、鼬鼠、蝙蝠等)及家养动物(狗、猫、牛等)与人之间构成狂犬病的传播环节。
人主要被病兽或带毒动物咬伤后感染。
一旦受染,如不及时采取有效防治措施,可导致严重的急性传染病,病死率高。
狂犬病是由狂犬病病毒(rabies virus,RV)引起的中枢神经系统感染的急性人畜共患传染病。
所有温血动物都可感染,狂犬病一旦发病,病死率几乎100%[1],是人类病死率最高的急性传染病之一。
该病流行于100 多个国家和地区, 中国的狂犬病发病率占世界第二位, 仅次于印度[2]。
狂犬病病毒基因组是由11 928 或11 932 个核苷酸组成的单股负链、不分节段的RNA,分子量约4.6×106。
基因组从3′端至5′端的排列依次为N、NS、M、G、L 5 个结构基因,各基因的序列长度分别为1 421、991/804/805、1 675/2 059、2 069、6 429/6 384 个核苷酸,分别编码病毒的核蛋白(N)、磷酸化蛋白(NS)、基质蛋白(M)、糖蛋白(G)和依赖RNA 的RNA 多聚酶(L)5 个主要结构蛋白[3]。
N蛋白是组成的主要,是诱导细胞免疫的主要成分,常用于的诊断、分类和流行病学研究。
1993 年 Bourhy [4]等人根据狂犬病毒属N基因的氨基酸和核苷酸相似的百分率,将狂犬病毒属分为6种基因型:基因型l(CVS原型株)、基因型2(Lagos -bat病毒原型株)、基因型3(Mokola 病毒原型株)、基因型4(Duvenhage 病毒原型株)、基因型5(EBL1欧洲蝙蝠狂犬病毒)、基因型6(EBL2)。
1996 年7 月,澳大利亚首次报道了发现于果蝠体内的Lyssavirus,被定为基因7 型,即ABLV[5]。
在中亚吉尔吉斯斯坦的小鼠耳蝠(Myotis blythi)中分离到Aravan 病毒,对其N基因及推导的氨基酸序列进行分析,发现它与已知的7 个基因型的病毒均有明显区别,MAbs 检测其抗原特性与其他类型的病毒也有区别,因此有人认为这是一种新的基因型[4]。
因而本文章对狂犬病毒的7个基因型的毒株做些简单的生物信息学的分析研究,进而推断出其间的联系。
1 材料和方法1.1 基因序列的获得从Gene Bank上检索狂犬病病毒基因型l(CVS原型株)、基因型2(Lagos-bat 病毒原型株)、基因型3(Mokola 病毒原型株)、基因型4(Duvenhage病毒原型株)、基因型5(EBL1欧洲蝙蝠狂犬病毒)、基因型6(EBL2)、基因型7(ABLV)、印第安娜州的水泡性口炎病毒、麻疹病毒、小反刍兽疫病毒、Rio Mamore病毒、传染性鲑鱼贫血病毒、人类冠状病毒229E、禽传染性支气管炎病毒的编码核蛋白的基因序列和其氨基酸序列。
1.2 ABLV核蛋白的理化性质、跨膜区、结构域及结构预测对Gene Bank上下载狂犬病毒的不同基因型分离毒株核蛋白基因序列及其核蛋白氨基酸序列。
采用在线软件Protparam和Protscal ( http: / /www. expasy. ch /tools /protscale.html) 对其蛋白质的理化性质和疏水性进行分析。
核蛋白跨膜区分析用工具TMpred;蛋白质二级结构的预测采用CFSSP工具分析(.org/tool);结构域采用InterPro工具分析;蛋白质三级结构预测采用SWISS-MODEL/Phyre。
1. 3 ABLV与其它基因型的狂犬病毒系统进化分析比较对已经提交Gene Bank的狂犬病毒7个不同基因型的病毒ABLV、cvs、Duvenhage、EBL1、EBL2、Lagos-bat、Mokola的核蛋白基因进行系统进化分析。
通过CLUSTALX 对序列进行比对,然后采用MEGA 5.10 软件基于NJ( neighbor-joining) 法构建系统进化树,自举分析通过1000次循环实现。
2 结果2.1 ABLV核蛋白的理化性质及结构预测2.1.1 ABLV核蛋白理化性质核蛋白包含1353个核苷酸,编码450个氨基酸,氨基酸组成见图1,分子量为50.6763kDa,理论等电点为6.04,氨基酸组成为Ala (A) 33、Arg (R) 23、Asn (N) 20、Asp (D) 26、Cys (C) 6、Gln (Q) 11、Glu (E) 30、Gly (G) 29、His (H) 11、Ile (I) 29、Leu (L) 33、Lys (K) 26、Met (M) 12、Phe (F) 26、Pro (P) 16、Ser (S) 38、Thr (T) 29、Trp (W) 3、Tyr (Y) 21、Val (V) 26,蓝色区为可能的起始密码子,即为ATG,红色为终止密码子即为ATT,含强酸性氨基酸(Asp,Glu)56个,强碱性氨基酸(Arg,Lys)49个,消光系数在体外哺乳动物的红细胞的半衰期为30小时,在酵母中的半衰期大于20分钟,在细菌中的半衰期大于10小时。
蛋白质的不稳定指数为35.51,表明蛋白质的一级结构稳定。
脂肪指数为77.82。
总平均亲水性值为-0.297,核蛋白为亲水性蛋白,核蛋白含有较多的亲水性区域,分布较为均匀,其中25-50,150-175,260-280,350-400区段亲水性较高,表明这几个区域作为抗原表位的可能性较大。
结果见图2。
图1 ABLV核蛋白基因序列及对应的氨基酸序列Fig.1 Animo acid sequence and gene sequence of the N of ABLV图2 ABLV核蛋白的疏水性分析Fig.2 The hydrophobicity analysis of the N of AB LV2.1.2 跨膜区分析利用TMpred工具,得出的结果,如图3,可以分析到ABLV基因型的狂犬病毒核蛋白的氨基酸从343-365之间可能有跨膜螺旋。
图4,表明其跨膜区可能在350-400之间。
而利用TMHMM 工具,如图5,可能存在的跨膜区为200-250和300-350。
图3 ABLV核蛋白中可能存在的跨膜区分析Fig.3 the analysis of the transmembrane of ABLV nucleoprotein图4ABLV核蛋白中可能存在的跨膜区分析Fig.4 the analysis of the transmembrane of ABLV nucleoprotein图5 ABLV核蛋白可能存在的跨膜区分析Fig.5 the analysis of the transmembrane of ABLV nucleoprotein2.1.2 结构域分析所有的单股负链RNA病毒都包含完全由核蛋白包裹病毒基因组成的核糖核蛋白复合体。
核蛋白和单链RNA的复合体结构包括水泡性口炎病毒(VSV)和狂犬病病毒(RABV)两种弹状病毒家族成员。
N-端的结构域为45-230,N-端结构域的羟基末端存在一个RNA结合域,即N-端延伸到C-端的环状结构是RNA结合域。
C-端的结构域为233-447,具体作用还不清楚。
图6 ABLV核蛋白的结构域分析Fig.6 the analysis of the the structural domain of ABLV nucleoprotein2.1.3 ABLV核蛋白的二级及三级结构预测二级结构在线预测结果表明,核蛋白二级结构中α-螺旋占62.4%、β-折叠占37.6%、无规则卷曲占12.2%,见图7。
利用SWISS-MODEL进行三维结构预测,但是没有与其相似的三级结构。
利用Phyre对氨基酸序列进行三级结构预测,能选出相近的三级结构,如图8和9。
图8中蓝色箭头表示β-折叠;绿色螺旋表示α-螺旋;其他氨基酸序列都为无规则卷曲。
图9中枚红色为α-螺旋;黄色箭头为β-折叠;其他区域为无规则卷曲。
图7 VP1二级结构预测Fig. 7 The secondary structure forecast图8 ABLV核蛋白与已知类似序列的比对Fig.8 the alignment of ABLV nucleoprotein with known similar sequence图9 ABLV核蛋白三级结构预测Fig.9 the tertiary structure prediction of ABLV nucleoprotein2.2 多序列比对分析及系统进化树对狂犬病毒ABLV的核蛋白氨基酸序列和其他从Gene Bank下载的病毒的核蛋白氨基酸序列进行多个序列比对。
利用MEGA 5.10软件构建NJ进化树(图10)。
图上的英文名对应中文名依次为7个基因型的狂犬病毒、印第安娜州的水泡性口炎病毒、麻疹病毒、小反刍兽疫病毒、Rio Mamore病毒、传染性鲑鱼贫血病毒、人类冠状病毒229E、禽传染性支气管炎病毒。
从图上可以看出7个基因型的狂犬病毒的亲缘关系比其它病毒的关系近;7个基因型的狂犬病毒、印第安娜州的水泡性口炎病毒、麻疹病毒、小反刍兽疫病毒与Rio Mamore病毒、传染性鲑鱼贫血病毒、人类冠状病毒229E、禽传染性支气管炎病毒为两大类病毒,即亲缘关系较远,其中印第安娜州的水泡性口炎病毒与7个基因型的狂犬病毒的亲缘关系最近;麻疹病毒与小反刍兽疫病毒和人类冠状病毒229E、禽传染性支气管炎病毒的亲缘关系比7个基因型的狂犬病毒之间的近,其他的之间较远。
图10 病毒核蛋白系统进化树(节点处数字表示重复1000次的Bootstrap值)Fig.10 Phylogenetic tree of the virus nucleoprotein3 分析讨论近年来, 在我国不同地区出现了狂犬病发病潜伏期变短等新的流行特征, 这可能意味着我国流行的街毒的毒力与致病性有增强[6]。