蛋白质结构预测
序列基序识别 二硫键识别 折叠子识别 残基接触预测 结构域预测
结构表面识别
预测蛋白质表面结构功能关键区域
5
PredictProtein Secondary Structure
PredictProtein Secondary Structure
H:螺旋 E:折叠 L:环 e:暴露表面﹥16%残基 b:其它残基
3
PredictProtein提交界面
序列提交窗口
分析方法程序详解
PROFsec(默认) PROFacc(默认) 序列预测
基于轮廓(profile)的神经网络算法预测蛋 白质二级结构 基于轮廓(profile)的神经网络算法预测残 基溶剂可及性
PHDhtm(默认)
ASP(默认) COILS(默认) PROFtmb ProSite(默认) SEG(默认) PredictNLS(默认) DISULFIND(默认) AGAPE PROFcon ProDom(默认) CHOP ConSeq
22
SWISS-MODEL
• SWISS-MODEL是一个蛋白质3D结构数据库,库中收录的蛋白质结
构都是使用SWISS-MODEL同源建模方法得来的。
– /
• 基于同源建模法与PDB数据库已知结构的蛋白质序列比对 进行预测
23
SWISS-MODEL
蛋白质三维结构预测
方法 特点 工具
同源建模法 基于序列同源比对,对于序列相似度>30% SWISS-MODEL, CPHmodels ( Homology/Comparativ 的序列模拟比较有效,最常用的方法 e modelling ) 线串法/折叠识别法 (Threading/Fold recognition) 从头预测法 ( Ab initio/De novo methods ) “串”入已知的各种蛋白质折叠骨架内,适 于对蛋白质核心结构进行预测,计算量大 基于分子动力学,寻找能量最低的构象, 计算量大,只能做小分子预测
基于多序列比对预测跨膜区位置和拓扑结构
识别二级结构中构型变化的氨基酸 识别卷曲螺旋
识别革兰氏阴性菌膜Beta桶蛋白结构
搜索序列中保守基序 过滤序列中低复杂区域 基于实验数据预测序列核定位区域 识别序列中二硫键位置 基于折叠结构识别远源蛋白序列 预测单链中原子残基接触性 基于序列同源性来预测蛋白质结构域 预测蛋白质结构域
InterProScan工具
InterProScan/InterProScan/
选择需要的分析工具
结果返回形式
序列提交框
17
InterProScan工具
提交序列
选择需要的分析工具
运行
InterProScan工具
五、蛋白质三维结构
• 蛋白质的生物学功能在很大程度上取决于蛋白质的空间结 构,三级结构是蛋白质预测的最终目的。在一些较小的蛋 白质分子中一般只具有单结构域,这时,其三级结构就是 它的结构域。在较大的蛋白质分子中,则由两个或多个相 对独立的结构域组合并折叠成在空间上可明显区分的三维 结构。通常采用X射线晶体衍射及核磁共振等实验技术加 以验证,但对设备及技术要求很高。基于计算机的生物信 息学预测一般有三种方法:同源建模法、线串法和从头算 法,对蛋白质数据进行初步结构模拟。
蛋白定位预测
ProSite模体搜索结果
简单描述 Motif模式
PROSITE中的ID号
提交序列中出现该 Motif的位置
PredictProtein分析结果
SEG低复杂区域过滤
二硫键识别程序
PredictProtein分析结果
跨膜区预测
跨膜区
Loop
Helix
Sheet 非跨膜区
二级结构
11
数据库
InterPro数据库 网站
备注
整 合 Swiss-Prot 、 TrEMBL 和 PIR 数据库中有关的蛋白序列 和功能信息 有关蛋白质家族和结构域的数 据库 有关微生物蛋白质组自动、人 工注释的高质量数据库
UniProt
PROSITE HAMAP Pfam PRINTS ProDom SMART TIGRFAMS PIRSF Superfamily Gene3D PANTER
1
蛋白质二级结构分析工具
工具 PredictProtein Prof Jpred 网站 / 备注 提供多项蛋白质性质分析 , 并有较好准确性 /~phiwww/prof/ 基于 多重 序列 比对 预测 工 具 /~ww 基于Jnet神经网络的分析程 w-jpred/submit.html 序 , 并 采 用 PSI-BLAST 来 构建序列Profile进行预测, 对于 序列 较短 、结 构单 一 的蛋白预测较好 http://npsa-pbil.ibcp.fr/cgi可以 比较 各种 分析 方法 得 bin/npsa_automat.pl?page=npsa_sopm 到的结果,也可输出 “一 a.html 致性结果” http://coot.embl.de/~fmilpetz/SSPRED/ 基于 数据 库搜 索相 似蛋 白 sspred.html 并构建多重序列比对
30
SWISS-PdbViewer主要功能
(1)查看使用同源建模法预测的蛋白质结构; (2)计算电荷分布,估算易受影响的表面; (3)计算并显示不合理的原子接触、氢键、角度; (4)人工编辑序列,如氨基酸突变、loop区域重建、旋 转 指 定 的 化 学 键 , 并 通 过 能 量 最 小 化 ( energy minimization)调整修饰后蛋白质的结构; (5)测量原子之间距离和角度; (6)利用Ramachandran plot观察蛋白质结构的合理性。
HAMAP InterPro
Pfam
ProDom
SMART
InterPro数据库
• InterPro:/interpro/ • InterPro数据库由EBI开发,整合蛋白质家族、 结构域和功能位点等资源。 • 整合UniProt、PROSITE、Pfam等12个成员数 据库,检索结果准确。 • 目前最新的 InterPro 26.0 版本包含 20329 个条 目,涵盖5542个结构域、12370个蛋白质家族。
二、蛋白质二级结构预测
• 蛋白质二级结构预测不仅是联系其一级结构和三级结 构的桥梁和纽带,而且也是从一级结构预测其三级空 间结构的关键步骤。 基本的二级结构:α螺旋,β折叠, β转角,无规则卷 曲(coils)以及模序(motif)等蛋白质局部结构组件 。 • 蛋白质二级结构的预测程 序采用以下3种方法:(1)结合人工 神经网络、遗传算法等机器学习 方法,统计氨基酸出现频度; (2) 以二级结构为模板,建立序 列谱矩阵或未知特异性记分矩阵; (3)利用同源蛋白多重比对。
输入用户E-mail(选填) 自动模式
粘贴蛋白质序列 fasta
可以指定PDB数据库收 蛋白质作为参照模板
SWISS-MODEL结果分析
目标序列与靶 序列比对图形
模型蛋白预测信息
SWISS-MODEL结果分析
模型全局质量评估
模型局部质量评估 比对报告
建模报告 点击可展开或收缩报告
模板报告 四级结构建模报告报告 配体建模报告
Phyre2,3DPSSM
HMMSTR/ ROBETTA
21
同源建模
同源建模是目前最为成功且实用的蛋白质 结构预测方法同源建模的前提是已知一个 或多个同源蛋白质的结构。当两个蛋白质 的序列同源性高于30%,认为它们的三维 结构基本相同;序列同源性低于30%的蛋 白质难以得到理想的结构模型。 同源建模的大体过程分为4个步骤:1鉴定结构模板;2目 标序列和模板结构比对;3建立模型;4模型质量评估。
/uniprot/
http://www.expasy.ch/prosite/ http://www.expasy.ch/sprot/hamap/
收集了大量的覆盖众多蛋白质 / 结构域的多序列比对数据和隐 马尔科夫模型 /dbbrowser/PRINT 蛋白质指纹图谱数据库,提供 S/ 识别蛋白质家族的保守模序 http://prodes.toulouse.inra.fr/prodom/current/ht 基于 PSI-BLAST 的同源蛋白结 ml/home.php 构域数据库 用于鉴定和注释可移动结构域 http://smart.embl-heidelberg.de/ 并分析其结构 /TIGRFAMs/index.sht 基于隐马尔科夫模型搜索蛋白 质家族的工具 ml 提供从超家族到亚家族多层次 /iproclass/ 蛋白质分类系统网 /SUPERFAMIL 对所有完成基因组测序的蛋白 质,基于 SCOP 数据库的结构 Y/ 和功能注释 /Gene3D 描述全基因组蛋白质家族和结 构域 / 根据家族功能特异性区分蛋白 / 家族和亚家族,基于规范的术 语和代谢途径确定更精确功能
SOPMA
SSPRED
2
PredictProtein:蛋白质二级结构预测
• PredictProtein(/)是欧洲分子 生物学实验室提供的蛋白质序列和结构预测服务网站。访 问PredictProtein网站应先注册ID,进入序列提交界面。 程序默认分析方法包括:用PROFsec分析序列二级结构及残 基溶剂可及性;用PHDhtm分析序列潜在的跨膜拓扑结构; 用COILS预测卷曲结构;通过PROSITE搜索模体(motif),预 测序列潜在的功能,借助ProDom预测结构功能域等。 • PredictProtein可以获得功能预测、二级结构、基序、二硫 键结构、结构域等许多蛋白质序列的结构信息。该方法的 平均准确率超过72%,最佳残基预测准确率达90%以上。
文献
SWISS-MODEL模型评估
A
B
C
SWISS-MODEL结果分析
与模板序列比对结果, 并显示二级结构区域 螺旋