当前位置:
文档之家› 生物信息学 第六章 蛋白质结构预测及分子设计
生物信息学 第六章 蛋白质结构预测及分子设计
3、输入要找的蛋白名称或ID号等(如RecBCD, E. coli DNA repair)
4、点击”Go” 5、点击感兴趣的结果(1W36,进入MMDB) 结果列表中包含相关蛋白(powered by BLAST)、文献、结构域 (domain)、配体(ligand)、3D缩略图、三维查看器
在MMDB看搜到蛋白的结构(NCBI)
ProtParam 工具简介
基于蛋白质序列的组分分析 氨基酸亲疏水性等分析为高级结构预测提供参考 Expasy 开发的针对蛋白质基本理化性质的分析:
▪ ProtParam 工具
计算以下物理化学性质: •相对分子质量 •氨基酸组成 •等电点(pI) •消光系数 •半衰期 •不稳定系数 •总平均亲水性 ……
▪ MMDB (Molecular Modeling Database): NCBI的大分子三维结构 数据库,数据来自PDB
▪ 打开的单个蛋白的页面中包括 ▪ 文献、简单描述、入库日期、物种(taxonomy) ▪ 该蛋白的PDB, VAST链接(entire chain/View 3D Alignment) ▪ 三维查看器(Cn3D) ▪ 分子成分(图): chain, 3D domain, classification/family, ligand
氨基酸数目 相对分子质量
氨基酸组成
返回结果
正/负电荷残基数
原子组成 分子式
总原子数 消光系数
半衰期
E(Prot) = Num(Tyr)*Ext(Tyr) + Num(Trp)*Ext(Trp) + Num(Cystine)*Ext(Cystine) proteins in water measured at 280 nm: Ext(Tyr) = 1490, Ext(Trp) = 5500, Ext(Cystine) = 125 Absorb(Prot) = E(Prot) / Molecular_weight
蛋白质的结构
▪ 一级结构(primary):氨基酸序列 ▪ 二级结构(secondary):α螺旋、β片层、... ▪ 三级(维)结构(tertiary):亚基,结构域 ▪ 四级结构(quaternary):亚基之间特定的空间关系
蛋白结构与人类疾病 (重要性)
一些单氨基酸(aa)突变可引起蛋白结构的重大变化 CFTR的ΔF508突变改变螺旋结构,从而改变其功能 另一些变化则不明显 一些蛋白引起的疾病 囊肿性纤维化(cystic fibrosis): CFTR 镰刀性贫血: 血红蛋白 疯牛病: 朊蛋白 阿尔兹海默氏征: 淀粉样前体蛋白
构,PDP域 更多外部链接(对于RecBCD多达26个)
更多有用的链接
▪ PDB的外部链接中Compute pI Mw点击Chain B (可计算各链分子 量)
▪ 在打开的Compute pI/Mw页面中点击EX5B_ECOLI (ExPASy,大 量信息,链接)
▪ 在打开的UniProtKB/Swiss-Prot页面中点击EcoCyc:EG10824MONOMER (biocyc,参与的反应/路径图)
点击其中的PDB (RCSB)链接,显示
▪ 三维结构实验数据 ▪ 蛋白分类
SCOP链接: 结构域(家族,超家族) CATH链接: 域, Class, Architecture, Topology, Homology GO链接: 功能,过程,细胞组成 ▪ 更多信息 生化性质,配体,SNP (Sequence Details)图形显示各域的分布,类别,DSSP二级结
生物信息学 第六章 蛋白质结构预测 及分子设计
单个蛋白 涉及的问题 结构预测(2D, 3D) 物理化学性质 功能 空间位置 研究方法 提取 纯化 制作晶体,决定结构 理解机制,功能
引子
多个蛋白 涉及的问题 表达过程(DNARNA蛋白,调控网络) 相互作用(yeast two-hybrid,亲和层析) 蛋白家族(family) 检测(2D-PAGE,质谱仪,蛋白质芯片) 研究方法 基因组测序 蛋白预言 计算机分析结构 理解机制,功能
蛋白结构的主要仓库 – PDB
▪ 始建于1971 ▪ >32000个结构数据(其中约3万是蛋白)
读取PDB文件的门户网站 Swiss-Prot, NCBI, EMBL
PDB
CATH, Dali, SCOP, FSSP 解释PDB文件的数据库
用”PubMed”搜蛋白结构(NCBI)
1、进入”PubMed” 2、选择”Structure”
▪ 如果分析Swiss-Prot和TrEMBL数据库中序列 ▪ 直接填写Swiss-Prot/TrEMBL AC号(accession number)
▪ 如果分析新序列: ▪ 直接在搜索框中粘贴氨基酸序列
输入Swiss-Prot/TrEMBL AC号
将protein.txt蛋白质序列 粘贴在文本框中
实验数据
数据库搜索
结构域匹配
已知结构的 同源蛋白?
有
同源 建模
无 二级
结构预测 有
串线法
三维结构模型
可用的折 叠模型?
无
从头 预测
蛋白质的基本性质
蛋白质的基本性质:
相对分子质量 氨基酸组成 等电点(pI) 消光系数
半衰期
不稳定系数 总平均亲水性 …….
工具 AACompldent
Compute pI/Mw
蛋白质结构预测及分析的主要内容
蛋白质结构分析
蛋白质基本理化性质分析
蛋白质一级结构
蛋白质亲疏水性分析
蛋白质二级结构 蛋白质超二级结构
蛋白质跨膜区结构预测
蛋白质二级结构预测 (α螺旋,β折叠等)
蛋白质结构域分析
蛋白质三级结构
蛋白质三维结构模拟
蛋白质结构预测过程
蛋白质理化性质 和一级结构
ORF翻译 蛋白质序列
ProtParam
PeptideMass SAPS
蛋白质理化性质分析工具
网站
备注
利用未知蛋白质的氨基酸组成确 认具有相同组成的已知蛋白
计算蛋白质序列的等电点和分子 量
对氨基酸序列多个物理和化学参 数(分子量、等电点、吸光系数 等)进行计算
计算相应肽段的pI和分子量
利用蛋白质序列统计分析方法给 出待测蛋白的物理化学信息
不稳定系数
脂肪系数 总平均亲水性