当前位置:
文档之家› 第六章 蛋白质结构预测的原理与方法
第六章 蛋白质结构预测的原理与方法
25
五、蛋白质结构域的折叠模式与蛋白质结构分类数据库
26
1 蛋白质结构域的折叠模式
蛋白质结构域(domain): 是蛋白质分子中介于二级结构 和三级结构之间的结构层次。在分子量较大的球形蛋白质分 子中,一条多肽链可能折叠成两个或多个空间上互相独立的 区域,称为结构域。 结构域可以按照二级结构的种类及排列方式进行分类:
可以进行二级结构在线预测两个网站为: 1.PHD算法
PredictProtein网站的地址为:
/ 2.SSPro 4.0(神经网络) /
41
• PredictProtein
三、蛋白质二级结构预测的主要方法
35
• 二级结构预测的方法大体分为三代:
第一代是基于单个氨基酸残基统计分析
• 从有限的数据集中提取各种残基形成特定二级结构的 倾向,以此作为二级结构预测的依据。
第二代预测方法是基于氨基酸片段的统计分析
• 统计的对象是氨基酸片段
• 片段的长度通常为11-21
• 片段体现了中心残基所处的环境 • 在预测中心残基的二级结构时,以残基在特定环境形 成特定二级结构的倾向作为预测依据
16
④氢键。氢键是形成蛋白质中规则二级结构的主要作用力。
⑤熵效应。
17
熵效应:是热力学的一个概念。它是指在一 个封闭的并存在能量差异的系统中,虽然系 统内总能量保持守衡,但能量却总是不可逆 转地由高能区向低能区流动,最终达到能量
的分散与平衡的一种状态和趋势。
§6.2 蛋白质结构分析
一、蛋白质结构分类 蛋白质结构依据不同的层次可以分为四类: 1)一级结构(氨基酸序列)
③反平行的β折叠形成的β发夹具有特定的结构。 α螺旋间的短连接具有特定的结构与堆积。
④当较大的环区的N端与C端靠近时就形成环。 ⑤非规则性环区也可以按照其平面性、手性及N端与C 端的相对位臵进行分类。
24 α折叠
β折叠
α/β折叠
α+β折叠
四、超二级结构 二级结构间特定的组合构成超二级结构。 1)α螺旋一般以特定的角度相堆积,使得一个螺旋的突出 部分及凹槽部分与另外一个螺旋的凹槽部分及突出部分相 嵌合。 2)β折叠片/β折叠片、α螺旋/β折叠片间的堆积有常出 现的特定模式。 β折叠片中的β折叠股以多种拓扑结构 相连接,如希腊钥匙型结构等。平行的β折叠股间的连接 (特别是βαβ单元)总是右手型的。 随着已知蛋白质结构的增加,不断有新的超二级结构 类型出现。
29
(例如丝氨酸蛋白酶)并采取相似的三维结构。
2)序列的相似性有时可低到20%以下,但三维结 构在总体上是保守的。 3)蛋白质结构的核心在序列上及三维结构上均比 表面环区更保守。 同源的蛋白质往往具有相似的三维结构;但具有 相似的三维结构的蛋白质序列不一定是同源的。
§6.3 二级结构预测
31 蛋白质二级结构预测是蛋白质结构预测的 主要组成部分之一 。
42
43
分析方法程序详解
PROFsec(默认) PROFacc(默认) 1D序列预测
是PHDsec的改进版本:基于轮廓(profile) 的神经网络算法预测蛋白质二级结构 基于轮廓(profile)的神经网络算法预测残 基溶剂可及性
PHDhtm(默认)
ASP(默认) COILS(默认) PROFtmb ProSite(默认) SEG(默认) PredictNLS(默认) DISULFIND(默认) AGAPE PROFcon ProDom(默认) CHOP ConSeq
9
• 蛋白质结构预测问题 “序列-结构-功能 ” 三者之间的关系
….-Gly-Ala-Glu-Phe-….
FUNCTION
案例:朊病毒 又称蛋白质侵染因子。朊病毒是一类能侵染动物 并在宿主细胞内复制的小分子无免疫性疏水蛋白 质。
10
目前发现的由朊病毒引起的疾病并不多, 主要 有:人类中的库鲁病(Kuru病)、克—雅氏综合症 (CJD)、格斯特曼综合症(GSS)及致死性家族 性失眠症(FFI),动物中的水貂脑软化病,羊搔 症,马鹿和鹿的慢性消瘦病(萎缩病),猫的海绵 状脑病,疯牛病。这些疾病主要是引起神经系统和 肌肉组织的损坏。
33
基本策略(1) 相似序列→相似结构
QLMGERIRARRKKLK QLMGAERIRARRKKLK
二、蛋白质二级结构预测的意义
34
蛋白质二级结构预测不仅仅可以给出二级结构信息,在 实际工作中有广泛的用途。 ① 由蛋白质二级结构统计分析得到的规则可用于全新蛋白 质设计或蛋白质突变体的设计。 ② 当序列同源性较低时,二级结构的指认有助于确定蛋白 质间结构与功能的关系。 ③ 在同源蛋白质模建中,二级结构预测有助于建立正确的 序列比对关系。 ④ 在基于二级结构片段堆积的三级结构预测中正确的二级 结构预测是第一步。 ⑤ 二级结构的预测有助于多维核磁共振中二级结构的指认 ,同时也有助于晶体结构的解析。
分子的用左右圆偏振光吸收差异谱表示的光学活性。在 160-240nm的CD光谱可以快速了解蛋白质的二级结构, 因为α螺旋,β折叠和卷曲产生不同的CD谱。
• •
X射线晶体衍射
核磁共振光谱(nuclear magnetic resonance
spectroscopy, NMR)
三、蛋白质结构预测要解决的问题
五级结构(quinternary structure):蛋白质 与蛋白质、蛋白质与核酸相互作用时的空 间位臵关系。
二、周期性的二级结构 1)α螺旋是蛋白质结构中最常见的二级结构,由于在α 螺旋内部每隔3- 4个氨基酸残基形成氢键,因而本身的
22
稳定性较好。α螺旋由于与溶剂的作用或中间有脯氨酸 等也会发生弯曲。不同的残基对于α螺旋中间部位及N端 或C端出现的倾向性不同。 2) β折叠片是由带状的β折叠股间形成氢键而构成的, 在氨基酸序列上往往是不连续的。几乎所有的β折叠片 在沿着β折叠股的方向均发生右手的扭曲,在β折叠股 间形成左手的扭曲。某些残基倾向于出现在β折叠中。
GOR(Garnier-Osguthorpe-Robson) 方 法 基 于 信息论算法,是所有统计算法中理论基础最好的。 3 最近邻居方法
在最近邻居方法( nearest neighbor method)中 新测定的序列被归类于与已知的最相近的序列具有相同 的二级结构。
38 4 神经网络方法 相对而言神经网络方法便于应用,有较高的预测
当务之急 发展快速的能够对蛋白质的折叠类型进行识别的方法。
28
3 蛋白质分类数据库
蛋白质结构分类数据库 对于蛋白质预测 具有重要的意义。
两个重要的蛋白质结构分类数据库: 1)SCOP数据库 2)CATH数据库
六、蛋白质的进化 1 )同源性的蛋白质( homologous protein)是 从一个共同的祖先进化而来的,往往具有相关的功能
39
二级结构预测方法针对不同蛋白质所给出的 准确度可能会有很大差别。 1)单序列的预测准确度在60%左右。 2)应用多重序列对比信息的二级结构预测准 确度在 65%~85%之间。
五、二级结构在线预测
40
许多蛋白质二级结构预测程序可以从因特网上免费下载 至本地计算机进行蛋白二级结构预测。另外,还可以进行在 线计算:可以通过送 Email 的方式,也可以在因特网上实时 计算。
第六章 蛋白质结构预测 的原理与方法
2
主要内容 §6.1 概述 §6.2 蛋白质结构分析 §6.3 二级结构预测 §6.4 三级结构预测
3
主要分析软件资源
ExPASy
/p念 蛋白质结构预测:指从蛋白质的氨基酸序列预测出 其三维空间结构。
– / • 可以获得功能预测、二级结构、基序、二硫键结构、结构域 等许多蛋白质序列的结构信息 • 该方法的平均准确率超过72%,最佳残基预测准确率达90% 以上。因此,被视为蛋白质二级结构预测的标准。 • 需要学术邮箱注册
PredictProtein提交界面
6
第二套遗传密码:蛋白质的氨基酸序列与其三维空 间结构间的关系。
蛋白质折叠:指蛋白质的氨基酸序列可折叠成具有 生物活性的三维空间结构。
7
序列模体(motif):通常指蛋白质序列中相邻或相 近的一组具有保守性的残基(或称基序),它与蛋 白质分子及其家族的功能有关。
二、蛋白质结构数据的获得
8
•
圆二色性(circular dichroism, CD),描绘了不对称
19
2)二级结构(规则结构,如a螺旋、 折叠)
3)三级结构(简单蛋白质的三维空间结构,或复 杂蛋白质亚基的三维空间结构) 4)四级结构(亚基的组装)
一级结构
20
….-Gly-Ala-Glu-Phe-….
二级结构
三级结构
四级结构
21
四级结构(quaternary structure):由多个亚 基组成的蛋白质分子的空间结构。
准确度。最大的缺点是没有明确的物理化学意义。 其
中PHD方法 是广泛应用的预测方法。 5 基于多重序列比对的二级结构预测
基于单个序列的二级结构预测方法的预测准确
度相对较低,大约在 58%左右。而基于多重序列比 对的二级结构预测方法 PSI-PRED 的预测准确度可达 到77%。
四、二级结构预测的准确度
蛋白质 序列: 二级结构:
一、蛋白质二级结构预测概述
32
• 蛋白质的二级结构预测的基本依据是: 每一段相邻的氨基酸残基具有形成一定二级 结构的倾向。 • 二级结构预测问题是模式分类问题
• 二级结构预测的目标:
• 判断每一段中心的残基是否处于螺旋、折叠、 转角(或其它状态)之一的二级结构态,即三态。
11
β折叠,正 常3% 致病43%
12
致病机理
1982年普鲁辛纳提出了朊病毒致病的“蛋白质构象致 病假说”,以后魏斯曼等人对其逐步完善。其要点如 下:①朊病毒蛋白有两种构象:细胞型(正常型PrPc )和瘙痒型(致病型PrPsc)。两者的主要区别在于其 空间构象上的差异。PrPc仅存在a螺旋,而PrPsc有多 个β折叠存在,后者溶解度低,且抗蛋白酶解;② Prpsc可胁迫PrPc转化为PrPsc,实现自我复制,并产 生病理效应;③基因突变可导致细胞型PrPsc中的α螺 旋结构不稳定,至一定量时产生自发性转化,β片层 增加,最终变为PrPsc型,并通过多米诺效应倍增致病 。