当前位置:
文档之家› 七蛋白质结构预测与功能初步注释
七蛋白质结构预测与功能初步注释
Web
Web
/software/COILS_form. Web/Li html nux http://bioweb.pasteur.fr/seqanal/interfaces/pepco il.html http://www.cbs.dtu.dk/services/TargetP/ Web/Li nux Web
带正电荷的极性R基
赖氨酸 Lys K 精氨酸 Arg R 组氨酸 His H
带负电荷的极性R基
天冬氨酸 Asp D 谷氨酸 Glu E
蛋白质基本理化性质分析
蛋白质理化性质是蛋白质研究的基础 蛋白质的基本性质: 相对分子质量 氨基酸组成 等电点(PI) 消光系数 半衰期 不稳定系数 总平均亲水性 …… 通过传统实验方法研究蛋白质的理化性质: • 相对分子质量的测定、等电点实验、沉降实验 • 缺点:费时、耗资 因此发展了基于实验经验值的计算机分析方法
/tools/protscale.html
• 收集50多个文献中提供的氨基酸标度 • 默认值为Hphob. Kyte & Doolittle,做疏水 性分析
主要选项/参数
序列在线提交形式:
• 如果分析SWISS-PORT和TrEMBL数据库中序列 – 直接填写Swiss-Prot/TrEMBL AC号(accession number)
//logo.cgi
Varieties of protein domains
Extending along the length of a protein
Occupying a subset of a protein sequence
Occurring one or more times
– 直接填写Swiss-Prot/TrEMBL AC号(accession number)
• 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
输入Swiss-Prot/TrEMBL AC号
在搜索框中 粘贴序列
输出结果
• 输入Swiss-Prot/TrEMBL AC号—分不同的功能域肽段
功能域
Protparam首先探测出目标 蛋白中都有哪些功能域, 然后分不同的功能域计算 其理化参数
According to InterPro at EBI (/interpro/): A domain is an independent structural unit, found alone or in conjunction with other domains or repeats. Domains are evolutionarily related. According to SMART (http://smart.embl-heidelberg.de): A domain is a conserved structural entity with distinctive secondary structure content and a hydrophobic core. Homologous domains with common functions usually show sequence similarities.
PROSITE (/prosite) is a dictionary of motifs (there are currently >1700 entries)(9/04). In PROSITE, a pattern is a qualitative motif description (a protein either matches a pattern, or not). In contrast, a profile is a quantitative motif description. We will encounter profiles in Pfam, ProDom, SMART, and other databases.
Protein domains and motifs
Signature: • a protein category such as a domain or motif Domain: • a region of a protein that can adopt a 3D structure • a fold • a family is a group of proteins that share a domain • examples: zinc finger domain
• 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
氨基酸标度
输入Swiss-Prot/TrEMBL AC号
粘贴 序列
计算窗口(7-11)
相对权重值 权重值变化趋势
输出结果
输入Swiss-Prot/TrEMBL AC号—分不同的功能域肽段
功能域
用户自定义区段
• 点击不同功能域或直接粘贴氨基酸序列的方式得到以下结果 • 蛋白质序列疏水区域分布预测图
Definition of a motif
A motif (or fingerprint) is a short, conserved region of a protein. Its size is often 10 to 20 amino acids.
Simple motifs include transmembrane domains and phosphorylation sites. These do not imply homology when found in a group of proteins.
蛋白质二级结构预测
TMpred /software/TMPRED_for Web m.html
TMHMM
TopPred 2 COILS PEPCOIL TargetP
http://www.cbs.dtu.dk/services/TMHMM/
http://bioweb.pasteur.fr/seqanal/interfaces/toppr ed.html
蛋白质二级结构预测
蛋白质二级结构预测
• 基本的二级结构
– α螺旋,β折叠, β转角,无规则卷曲(coils)以及 模序(motif)等蛋白质局部结构组件
• 分析方法
– 基于统计和机器学习方法进行预测
• 分析内容
– α螺旋/β折叠等基本结构 • PHD,JPRED,PROF,PSIpred,NNSSP – 信号位点的分析 • SignalP,PSORT,TargetP
Chapter 6 蛋白质结构预测与 功能初步注释
蛋白质序列结构信息
1. 氨基酸的理化性质分析
2. 蛋白质的亚细胞定位 3. 结构域分析 4. 膜蛋白的跨膜区预测 5. 蛋白质序列的二级结构预测 6. 蛋白质序列的三级结构预测
确定功能和结构
• 蛋白质结构预测问题 序列——结构——功能
….-Gly-Ala-Glu-Phe-….
首先从蛋白质的一级结构开始。。。
氨基酸按其R基的极性分类(在PH7)
非极性R基 丙氨酸 Ala A 缬氨酸 Val V 亮氨酸 Leu L 异亮氨酸 Ile I 脯氨酸 Pro P 苯丙氨酸 Phe F 色氨酸 Trp W 蛋氨酸 Met M 不带电荷的极性R基 甘氨酸 Gly G 丝氨酸 Ser S 苏氨酸 Thr T 半胱氨酸 Cys C 酪氨酸 Tys Y 天冬酰胺 Asn N 谷氨酰胺 Gln Q
胞吞 蛋白转运
蛋白质二级结构预测
BCM Search Launcher Protein Sequence Analysis PHD ANTHEPROT SOMPA Jpred PSIpred SSPRED NNPREDICT PROF /seq-search/strucpredict.html http://bioweb.pasteur.fr/seqanal/protein/introuk.html http://www.embl-heidelberg.de/predictprotein/ http://antheprot-pbil.ibcp.fr/ http://npsa-pbil.ibcp.fr/cgibin/npsa_automat.pl?page=npsa_sopma.html /~wwwjpred/submit.html /psipred/psiform.html http://www.embl-heidelberg.de/sspred/ssp_mul.html /~nomi/nnpredict.htm l /~phiwww/prof/index.html Web Web Web Windows Web Web Web Web Web Web/Lin ux
PSORT
http://psort.ims.u-tokyo.ac.jp/
Web
NNPREDICT
(/~nomi/nnpredict.html)
结构域分析
• 结构域是蛋白序列的功能、结构和进化单元
• The conserved motifs may be used to build characteristic signatures that aid family and /or functional diagnoses of newly determined sequences.
immunoglobulin domain
Motif (or fingerprint): • a short, conserved region of a protein • typically 10 to 20 contiguous amino acid residues
Definition of a domain
图形结果 文本结果 序列 参数
每个位置的得分
蛋白质的亚细胞定位