当前位置:
文档之家› 蛋白质的序列分析及结构预测分析
蛋白质的序列分析及结构预测分析
• 1 mkgktaaggg aicaiavmit ivmgngnvrt nqaglelign aegcrrdpym cpagvwtdgi • 61 gnthgvtpgv rktdqqiaad wekniliaer cinqhfrgkd mpdnafsamt saafnmgcns • 121 lrtyyskarg mrvetsihkw aqkgewvnmc nhlpdfvnsn gvplrglkir rekerqlclt • 181 glvne
研究现状
• 不同的氨基酸残基对于形成不同的二级结 构元件具有不同的倾向性。 • 目前一级结构和二级结构的分析已经得到 了充分研究 • 三级结构的预测较为困难:最理想的方法 是对蛋白质结构数据或相关资源进行同源 性检测 • 近年来出现了一些新的方法可以直接从一 级结构到三级结构
介绍几个二级结构概念
• 结果表明,该蛋白质只由着3中二级结 构组成,即α-螺旋(Alpha helix),占 41.62%;随机卷曲(random coil),占 50.81%;延伸链(extended strand), 占7.57%。
其他特殊局部结构的分析
• 信号肽 • 膜蛋白的跨膜螺旋即跨膜区的预测 • 卷曲螺旋(Coiled Coils)
以ExPASy软件为例 基本理化性质分析
氨基酸数量 185 等电点 为9.19
氨基酸组成
分子式和总 原子数
疏水性分析
疏水性分析图
以0为界,上面的正值表示 疏水性,负值表示亲水性
酶切特性预测
蛋白质结构预测分析
• 蛋白质的结构通常包括4个层次: • 一级结构,即氨基酸的排列顺序 • 二级结构,主要是由氢键维持的α-螺旋和β片层 • 三级结构,完全折叠好的蛋白质空间结构 • 四级结构,多个蛋白亚基组成的蛋白复合 体结构
三级结构图片
序有 列信 分号 析肽 的 蛋 白
跨膜区预测--两种不同软件预测结构 对比
跨 膜 区 分 析
跨其 膜他 区软 分件 析分 析 的
卷曲螺旋(Coiled Coils)
三级结构的预测
• 利用ExPASy: 点击/tools/
点击SWISS-MODEL进行三级结构预测 具体步骤如下
上述分析结果
• 10 20 30 40 50 60 70 • | | | | | | | • MKGKTAAGGGAICAIAVMITIVMGNGNVRTNQAGLELI GNAEGCRRDPYMCPAGVWTDGIGNTHGVTPGV • cccccccchhhhhhhhhheeeeeccccccccccceheecccccccccc cccccccccccccccccccccc • RKTDQQIAADWEKNILIAERCINQHFRGKDMPDNAFSA MTSAAFNMGCNSLRTYYSKARGMRVETSIHKW • ccchhhhhhhhhhhhhhhhhhhhhhccccccchhhhhhhhhhhhhc chhhhhhhhhhccccchhhhhhhh • AQKGEWVNMCNHLPDFVNSNGVPLRGLKIRREKERQ LCLTGLVNE • hcccceeehhcccccccccccccccchhhhhhhhhheeecccccc
蛋白质的序列分析及结构 预测分析
• 蛋白序列
• • • • • • • 分子量 等电点 原子总数 正电荷残基数 稳定系数 脂肪系数 总平均疏水性等 酶切特性 分子式 负电荷残基数
以已知蛋白质序列为例 Lyz [Enterobacteria phage P1]
各二级结构所占比例
• HNN : • Alpha helix (Hh) : 77 is 41.62% • 310 helix (Gg) : 0 is 0.00% • Pi helix (Ii) : 0 is 0.00% • Beta bridge (Bb) : 0 is 0.00% • Extended strand (Ee) : 14 is 7.57% • Beta turn (Tt) : 0 is 0.00% • Bend region (Ss) : 0 is 0.00% • Random coil (Cc) : 94 is 50.81% • Ambigous states (?) : 0 is 0.00% • Other states : 0 is 0.00%
• Alpha helix :α螺旋
• Extended strand (Ee):延伸链或伸展 链。主要是位于α-螺旋和随机卷曲之 间结构。 • Random coil (Cc):随机卷曲
利用HNN软件进行二级结构预测方法
• 网址: http://npsapbil.ibcp.fr/cgibin/npsa_automat .pl?page=/NPSA/npsa_hnn.html
相关软件程序
• Compute pI/MW:是ExPASy (http://www.expasy.ch/tools/)工具包中 的程序,计算蛋白质的等电点和分子量。 对于碱性蛋白质,计算出的等电点可能不 准确。 • PeptideMass:是ExPASy工具包中的程序, 分析蛋白质在各种蛋白酶和化学试剂处理 后的内切产物。蛋白酶和化学试剂包括胰 蛋白酶、糜蛋白酶、LysC、溴化氰、ArgC、 AspN和GluC等。
信号肽分析
• 指分泌蛋白表达时氨基端的20余个氨基酸, 将引导该蛋白质最终分泌至细胞外,但这 段信号肽会被信号肽酶切掉,所以成熟的 分泌蛋白是不含这段信号肽的。 • 用于指导蛋白质的跨膜转移(定位)的N末 端的氨基酸序列,一般由15-30个氨基酸组 成。
C-score (raw cleavage site score):原始剪切位点得分 S-score (signal peptide score):信号肽分数 Y-score (combined cleavage site score):被结合得剪切 位点的分数
点击 SWISS-MODEL - An automated knowledge-based protein modelling server
页面左边工作栏
• Modelling myWorkspace Automated Mode Alignment Mode Project Mode 点击myWorkspace或Automated Mode 进入下面界面