当前位置:文档之家› 生物信息学论文汇总

生物信息学论文汇总

生物信息学论文学院:生命科学技术学院专业:生物科学班级:2013级老师:***学生:王秉政学号:***********黑曲霉GH75及米曲霉GH76-5基因生物信息学分析王秉政(黑龙江八一农垦大学,生命科学技术学院,2013级生物科学专业,黑龙江省,大庆市)【摘要】目的:分析和预测黑曲霉GH75和米曲霉GH76-5基因及其编码蛋白质的结构和特征。

方法:利用NCBI、CBS和ExPASy网站中的各种信息分析工具,并结合VectorNTIsuite8.0生物信息分析软件包,分析预测黑曲霉GH75和米曲霉GH76-5基因并预测该基因编码蛋白结构的特征和功能。

结果:GH75基因全长174bp,编码区具有57个氨基酸,在GenBank同源序列中,基因氨基酸序列一致性达到100%,且有GH75保守域。

GH75蛋白相对分子量预测为26257.2,理论等电点为4.69。

预测GH75编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是11.07%、25.41%、63.52%,1个GTPase结构域。

GH75编码区具有102个氨基酸,在GenBank同源序列中,其与列一致性达到100%,且有GH76-5保守域。

GH76-5蛋白相对分子量预测为46029.3,理论等电点为5.28。

预测GH76-5编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是26.90%、20.71%、52.38%,2个GTPase结构域。

GH76-5蛋白为疏水蛋白,无跨膜区,无信号肽。

结论:成功预测GH75和GH76-5基因及其编码蛋白生化及其结构特征,为下一步对其进行克隆和表达奠定基础。

【关键词】黑曲霉、米曲霉;糖基水解酶家族(GH75);糖基水解酶家族(GH76-5)生物信息学黑曲霉是一种重要工业微生物,在酶制剂、异源蛋白、有机酸等领域应用广泛。

2007年黑曲霉基因组的公布将黑曲霉的研究引入后基因组时代,各种组学数据如雨后春笋般涌现,人们对黑曲霉高效生产机制的理解上升到系统、分子层次;与此同时,黑曲霉遗传操作系统也不断成熟,为系统地研究和改造黑曲霉、将黑曲霉打造成通用细胞工厂奠定了基础。

米曲霉是一类产复合酶的菌株,除产蛋白酶外,还可产淀粉酶、糖化酶、纤维素酶、植酸酶等。

在淀粉酶的作用下,将原料中的直链、支链淀粉降解为糊精及各种低分子糖类,如麦芽糖、葡萄糖等;在蛋白酶的作用下,将不易消化的大分子蛋白质降解为蛋白胨、多肽及各种氨基酸,而且可以使辅料中粗纤维、植酸等难吸收的物质降解,提高营养价值、保健功效和消化率,广泛应用于食品、饲料、生产曲酸、酿酒等发酵工业,并已被安全地应用了1000多年。

米曲霉是理想的生产大肠杆菌不能表达的真核生物活性蛋白的载体。

米曲霉基因组所包含的信息可以用来寻找最适合米曲霉发酵的条件,这将有助于提高食品酿造业的生产效率和产品质量。

一、资料与方法1.1资料通过ExPASy 数据库的UniProtKB(或/uniprot)获得黑曲霉的GH75与米曲霉GH76-5基因序列。

GH75基因编号为4990860.,NCBI的登录号为XM_001401782.1. ,其他物种的GH75的氨基酸序列均来自Genbank,登录号见图1。

GH76-5基因编号为4987208.,NCBI的登录号为XM_001400940.2. ,其他物种的GH76-5的氨基酸序列均来自Genbank,登录号见图2。

1.2方法利用美国国家生物技术信息中心(NCBI,)的基本局部比对搜索工具(BLAST,/blast/),运用Blastx完成基因同源性分析。

应用ORF finder(/gorf/orfig.cgi)寻找其开放读码框,并推导出可编码蛋白序列。

利用保守结构域(/Structure/cdd/wrpsb.cgi)分析预测其保守域。

通过瑞士生物信息学研究所的蛋白分析专家系统(ExPASy,)所提供的蛋白组学和分析工具:Protparam 程序分析GH75及GH76-5蛋白氨基酸组成、相对分子质量、等电点等基本理化性质;TMHMM 程序预测GH75及GH76-5的跨膜区;Proscale 程序分析GH75及GH76-5的蛋白性质;SignalP 程序预测GH75及GH76-5蛋白的信号肽,GOR 超链接分析GH75及GH76-5的二级结构,SWISS-MODEL 通过二级结构比对和折叠,模拟蛋白质的空间构象。

利用SMART (http://smart.embl-heidelberg.de/)分析预测其结构域。

二、结果2.1基因序列的分析 BLASTx 分析结果表明,GH75与多个物种的GH5基因同源,其中与Aspergillus niger contig An04c0140, genomic contig 的同源性最高,一致性达100%,相似度达99%(图1)。

ORF Finder 获得其开放阅读框编码氨基酸序列,该基因全长174bp,编码区为2-174bp ,编码57个氨基酸,无起始密码子,终止密码子TAA ,不编码蛋白(图3)。

CCD 分析发现有GH75保守域。

BLASTx 分析结果表明,GH76-5与多个物种的GH6基因同源,其中与Aspergillus niger contig An14c0130, genomic contig 的同源性最高,一致性达100%,相似性达100%(图2)。

ORF Finder 获得其开放阅读框编码氨基酸序列,该基因全长309bp,编码区为1-308bp ,编码102个氨基酸,无起始密码子,终止密码子TGA ,不编码蛋白(图4)。

CCD 分析发现有GH76-5保守域。

2.2编码蛋白的特征分析2.2.1蛋白质的基本参数GH75蛋白相对分子量预测为26257.2,理论等电点为4.69,脂肪系数为75.94。

在溶液中的不稳定系图3 ORF Finder 图1 BLASTx图2 BLASTx图4 ORF Finder数是25.26,为稳定蛋白。

当蛋氨酸在N 端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。

氨基酸的组合物(图5),原子组成(图6)。

带负电荷的残基总数13,带正电荷的残基总数27。

当蛋白浓度为1g/L ,所有的半胱氨酸残基形成半胱氨酸时,吸光指数(ABS )为1.629,在水中280nm 摩尔消光指数为42775;所有的半胱氨酸残基不形成半胱氨酸时,吸光指数(ABS )则为 1.615,在水溶液中280nm 摩尔消光指数为42400。

总的亲水性平均疏水性指数(grand average of hydropathieity )为-0.204,预测为亲水蛋白。

GH76-5蛋白相对分子量预测为46029.3,理论等电点为5.28,脂肪系数为64.67。

在溶液中的不稳定系数是27.19,为稳定蛋白。

当蛋氨酸在N 端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。

氨基酸的组合物(图7),原子组成(图8)。

带负电荷的残基总数33,带正电荷的残基总数42。

当蛋白浓度为1g/L ,所有的半胱氨酸残基形成半胱氨酸时,吸光指数(ABS )为 1.970,在水中280nm 摩尔消光指数为90675;所有的半胱氨酸残基不形成半胱氨酸时,吸光指数(ABS )则为1.962,在水溶液中280nm 摩尔消光指数为90300。

总的亲水性平均疏水性指数(grand average of hydropathieity )为-0.323,预测为亲水蛋白。

2.2.2疏水性分析、跨膜区分析TMHMM 预测GH75蛋白,提示有跨膜区,位于膜内(图9)。

Proscale 分析疏水性,结果也提示GH75为亲水蛋白(图10)。

SignalP 分析提示GH75有信号肽(图11)。

TMHMM 预测GH76-5蛋白,提示无跨膜区,位于膜外(图12)。

Proscale 分析疏水性,结果也提示GH75为疏水蛋白(图13)。

SignalP 分析提示GH76-5无信号肽(图14)。

图5 氨基酸组合物物 图6 原子组成 图7氨基酸组合图8 原子组成图9TMHMM图12 TMHMM图11 SignalP 图10Proscale图13 Proscale图14 SignalP2.2.3 二三级结构与结构域SMART预测可能存在1个小GTPase结构域(图15),GOR预测GH75编码蛋白二级结构中螺旋(H)、折叠(E)、无规则卷(L)的比例分别为11.07%、25.41%、63.52%,以无规则卷为主(图16)。

SWISS-MODEL 模拟GH75三维结构,应用vector NTI suite 软件包D molecule viewer显示蛋白质三维结构(图17)。

SMART预测可能存在2个小GTPase结构域(图18),GOR预测GH76-5编码蛋白二级结构中螺旋(H)、折叠(E)、无规则卷(L)的比例分别为26.90%、20.71%、52.38%,以无规则卷为主(图19)。

SWISS-MODEL 模拟GH76-5三维结构,应用vector NTI suite 软件包D molecule viewer显示蛋白质三维结构(图20)。

图15 SMART图16 GOR图17 D molecule viewer图20 D molecule viewer图18 SMART图19 GOR三、讨论GH75基因全长174bp,编码区具有57个氨基酸,在GenBank同源序列中,其与Aspergillus niger contig An04c0140, genomic contig基因氨基酸序列一致性达到100%,且有GH75保守域。

GH75蛋白相对分子量预测为26257.2,理论等电点为4.69。

预测GH75编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是11.07%、25.41%、63.52%,1个GTPase结构域。

GH75蛋白为亲水蛋白,有跨膜区,有信号肽。

GH76-5基因全长309bp,编码区具有102个氨基酸,在GenBank同源序列中,其与Aspergillus niger contig An14c0130, genomic contig基因氨基酸序列一致性达到100%,且有GH76-5保守域。

GH76-5蛋白相对分子量预测为46029.3,理论等电点为5.28。

预测GH76-5编码蛋白α螺旋(H ) 、β折叠(E )、无规则卷(L )的比例分别是26.90%、20.71%、52.38%,2个GTPase结构域。

相关主题