当前位置:文档之家› 蛋白质结构与功能预测

蛋白质结构与功能预测


Phyre • Phyre
-/~phyre/
• 3d-PSSM的升级版,增加了fold数据,并且性 能上提高10%-15%,采用了新的分析界面
输入用户Email(必需) 蛋白质描述(选填)
序列提交框(氨基酸单字母)
+ 在既没有已知结构的同源蛋白质、也没有 已知结构的远程同源蛋白质的情况下,上 述两种蛋白质结构预测的方法都不能用, 这时只能采用从头预测方法,即直接或仅 仅根据序列本身来预测其结构。
从头预测方法一般由下列3个部分组成:
+ 蛋白质几何的表示方法
– 由于表示和处理所有原子和溶剂环境的计算量 非常大,因此需要对蛋白质和溶剂的表示形式 作近似处理。
二级结 构预测
序列比对 靶 标 蛋 一 致 性 白模型
序列比对 结果
模板 长度
折叠子描述 模板蛋白结 构分类信息
+ 可视化分析蛋白质的高级结构,有利于从 原子间相互作用的层次理解生命活动过程 的信息控制机制,更加有效地揭示分子在 完成其功能过程中的演化情况,了解蛋白 质分子结构和各种微观性质与宏观性质之 间的定量关系。
a. 人谷胱甘肽-S-转硫酶pi第56到59位残基的β转角连接了来自相同主 链的两段β折叠链,β转角区域内第一个Asp的α羰基氧与其后第三位α
氨基成氢键; b. 来自人细胞珠蛋白的两段α螺旋由β转角连接。
+ 无规卷曲的结构特征为:
– 无规卷曲的特点为在主链骨架上无规则盘绕, 其构象状态仍遵循物理化学原理,但波动性较 大,对温度变化敏感;
– 通过表面对应区域的形状和理化性质互补以及 多位点协同实现与相应分子的特异性相互作用, 通常表面粗糙;
– 球状蛋白结构有柔韧性,且总处于亚稳定状态; 可通过动态结构变化改变其活性
a. 飘带显示全α螺旋人血清白蛋白单体三级结构,结构略微松 散(2T2Z.pdb);b. 飘带显示全α螺旋人血清白蛋白单体三级结
nbpinr/endpicsta._hatmutlomat.pl?page=npsa_sopma.ht 的氨结酸果拉,链也结可构输和出卷曲“螺一旋致性
ml
结果”
http://coot.embl.de/~fmilpetz/SSPRED/ssp 基于数据库搜索相似蛋白并
red.html
构建多重序列比对
人基质金属蛋白酶MMP14(Matrix metalloproteinase, MMP14)氨基酸序列的fasta形式 可从NCBI的蛋白质数据库获得 (>gi|4826834|ref|NP_004986.1|matrix metalloproteinase 14 preproprotein [Homo sapiens])。
+ 蛋白质三级结构的稳定主要靠氨基酸侧链 之间的疏水相互作用、氢键、二硫键、范 德华力和静电作用维持。
+ 不同类型的蛋白质尽管局部结构分解后具 有很高的相似性,但是在三级结构层面不 同的蛋白质将体现各自整体的结构特征通
+ 水溶性蛋白质三级结构的基本特征:
– 各二级结构恰当折叠尽可能使疏水氨基酸集中 在内部,亲水氨基酸分布在表面
Jpred二级结构预测
分析结果 H:代表α-螺旋;E:代表β-折叠;-: 代表无规则卷曲。由图看出:Jpred方法预测的 MMP14二级结构有8个α螺旋区(H)和23个β折叠 区(E),其他区域均为无规则卷曲区(-)。
2. SOMPA二级结构预测方 (1) 进入SO法MPA主页
(http://npsa-pbil.ibcp.fr/cgi-
其中Hh有150个氨基酸,占25.77%;Ee有110个氨基 酸,占18.90%;Tt有52个氨基酸,占8.93%;Cc有270个氨 基酸,占46.39%。Hh、Cc和Ee贯穿于整个氨基酸链,Tt主 要分布在氨基酸链的第300个氨基酸之后。
SOMPA预测结 果
+ 三级结构(protein tertiary structure),即 蛋白质分子处于它的天然折叠状态的三维 构象,它是在二级结构的基础上进一步盘 绕,折叠形成的。
0.54nm; – 相邻螺旋圈之间形成许多氢键; – 侧链基团位于螺旋的外侧。
人细胞珠蛋白(2DC3.pdb)的第121到140位残基 对应的a-螺旋侧面和顶部(N端)视图
β折叠示意图
b,c.人pi型谷胱甘肽-S-转硫酶中单个亚基中连续主链的部分β折叠,可见转角(turn);d. 人信号传递蛋白的一个亚基中部分β折叠结构顶部视图,可见到大的环区。
bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html);
(2) 在“Paste a protein sequence below”下 的空白处提交蛋白序列(原始序列),可以在参数 中进行符合我们要求的设置,然后点击“SUBMIT” 按钮进行分析;
(3) 查看结果,主要含有alpha helix (Hh)-螺旋 ,Extended strand (Ee)延伸链,Beta turn (Tt)转角,Random coil(Cc)无规卷曲。
– 按二级结构组装模式对蛋白质进行分类,对解析 蛋白质高级结构形成规律和预测蛋白质功能有 重要帮助。
– 蛋白质二级结构组装模式主要是全α螺旋、全β 折叠、α螺旋/β折叠,还有少量α螺旋+β折叠 类。

比较建模(comparative modeling)


的 结
穿线(threading)



自由建模(free modeling)
+ 一级结构 + 如何决定?
1
+ 蛋白质的初级结构指的是20种氨基酸有序的排列
主链
a-C原子
侧链
➢ 由于R的差异,氨基酸具有不同的构象和性质
2
+ 氨基酸大小
– 较小侧链的残基 或较大侧链的残基都使蛋白质 结构的不稳定
+ 极性
– 主链、侧链、溶剂分子两两之间形成氢键
+ 疏水性
– 在蛋白质折叠和结构稳定中起重要作用!
同源模型化方法,是蛋白质三维结构预测的主要方法。
+ 主要思想:
– 对于一个未知结构的蛋白质,找到一个已知结 构的同源蛋白质,以该蛋白质的结构为模板, 为未知结构的蛋白质建立结构模型。
+ 依据:
– 任何一对蛋白质,如果两者的序列相似部分超 过30%,则它们具有相似的三维结构,即两个 蛋白质的基本折叠相同,只是在非螺旋和非折
‫ ﺟ‬MODELLER
又称线索化方法 + 有很多蛋白质具有相似的空间结构,但它
们的序列相似部分小于25%,即属于远程同 源。
+ 对于这类蛋白质,很难通过序列比对找出 它们之间的关系,必须设计新的分析方法。
+ 基于“在众多蛋白质结构中,其折叠类型 (fold)是有限的(1000-2000个?)”
– 实验测定三级结构时往往无法识别无规卷曲(缺 失其座标),即使有座标则其温度因子也较高。 无规卷曲同Ω环的区分主要是其长度和其形状 的波动性。
+ 蛋白质二级结构预测的依据是:
– 每一段相邻的氨基酸序列都有形成特定二级结 构的倾向
➢ 蛋白质二级结构预测的问题是模式分类问题
‫ ﺟ‬判断每一段中心氨基酸残疾是否处于α螺旋、β折叠、β 转角之一的状态
jpred/submit.html
序 , 并 采 用 PSI-BLAST 来 构
建 序 列 Profile 进 行 预 测 , 对
于序列较短、结构单一的蛋
白预测较好
nSnOPPrMedAict SSPRED
hhttttpp::////anlpesxaa-npdbeirl.icbocmpp.fbr//~nomi/n 可预以测比蛋较白各质种序分列析中方潜法在得的到亮
+ 目标是为目标蛋白质U寻找合适的蛋白质模 板,这些模板蛋白质与U没有显著的序列相 似性,但却是远程同源的,即具有相匹配 的折叠结构。
+ 基本思想:首先将目标序列分割成若干片 段,并且匹配到已知的折叠结构中,根据 计算匹配得分、计算能量得分等进行分类
➢排代序表性、分评析估工;具选择最优的折叠结构作为模 板‫ ﺟ‬来Ph构yre建目标蛋白的三维结构。
构,树枝状显示氨基酸侧链,结构明显紧密;
+ 膜蛋白三级结构的基本特征:
– 难结晶,构型形成依然遵循基本规律
– 最常见的二级结构是α螺旋,且可以独立稳定 存在
– β折叠作为二级结构在膜蛋白中主要位于三级 结构内部,全β折叠膜蛋白必须采用特殊组装 模式,即形成β折叠桶。
+ 蛋白质三级结构中二级结构的折叠和组装:
网上免费下载至本地计算机进行蛋白二级
结构预测,也可以进行在线计算。
工具
网站
备注
HNN
http://npsa-pbil.ibcp.fr/cgi-
基于神经网络的分析工具,
bin/npsa_automat.pl?page=npsa_nn.html 含序列到结构过程和结构到
结构处理
Jpred
/~www- 基于Jnet神经网络的分析程
二、蛋白质二级结构的分析方法
– 二基于统计和机器学习方法进行预测 ➢Chou-Fasman算法 ➢GOR算法 ➢多序列列线预测 ➢基于神经网络的序列预测 ➢基于已有知识的预测方法 – (knowledge based method) ➢混合方法(hybrid system method)
+ 许多蛋白质二级结构预测程序可以从因特
+ 势函数及其参数
– 通过对已知结构的蛋白质进行统计分析确定势 函数中的各个参数。
+ 构象空间搜索技术
– 构象空间搜索和势函数的建立是从头预测方法 的关键。
1.SWISS-MODEL服务器自动模式 + 第一步:进入SWISS-MODEL三级结构预测 服务器主页
相关主题