实验五蛋白质序列分析
• 收集50多个文献中提供的氨基酸标度 • 默认值以Hphob. Kyte & Doolittle做疏水性分析
• ProtScale能计算超过50种蛋白质的特性。仅一项需要额外设
定的参数是输入框的宽度,该参数将指示系统每次运行计算
和显示的残基数,其缺省值为9。如果想考虑跨膜螺旋特性,
该参数设置应为20,因为一个跨膜螺旋通常有20个氨基酸长
学习交流PPT
21
四 蛋白质亚细胞定位预测
• 亚细胞定位与蛋白质的功能存在着非常重要的联系。亚细胞定位 预测基于如下原理:(1)不同的细胞器往往具有不同的理化环境,它 根据蛋白质的结构及表面理化特征,选择性容纳蛋白。(2)蛋白质表 面直接暴露于细胞器环境中,它由序列折叠过程决定,而后者取决于 氨基酸组成。因此可以通过氨基酸组成进行亚细胞定位的预测。
基因与蛋白质组学数据分析
实验五:蛋白质序列分析
学习交流PPT
1
实验项目五:蛋白质序列分析
一、 实验目的和要求: • 掌握蛋白质基本性质分析;基本理化性质和疏水
性分析。 • 掌握蛋白质信号肽的预测,亚细胞定位的预测,
跨膜结构及卷曲螺旋结构的预测。 • 了解基于motif、结构位点、结构功能域数据库的
三 信号肽预测
• 蛋白质合成后要运送到细胞中不同的部位,有的 蛋白质要通过内质网膜进入内质网腔内,最终成 为分泌蛋白。
• 分泌蛋白的N端都有一段约15~35个氨基酸的疏水 性肽段,其功能是引导蛋白质多肽链穿过内质网 膜进入腔内,称为信号肽(signal peptide)。
• 按照氨基酸组成及其位置特征,可将信号肽分为4 大类:
功能域
用户自定义区段
学习交流PPT
7
点击不同功能域得到以下结果
氨基酸数目 相对分子质量 理论 pI 值
氨基酸组成
正/负电荷残基数
学习交流PPT
8
原子组成 分子式
总原子数 消光系数
半衰期
学习交流PPT
9
9
不稳定系数
脂肪系数 总平均亲水性
<40 stable >40 unstable
学习交流PPT
基于实验经验值的计算机分析方法
软件 Bioedit
网络工具ProtParam, Compute PI
学习交流PPT
3
基于一级序列的组分分析
氨基酸亲疏水性等分析为高级结构预测提供参考
ExPASy( Expert Protein Analysis System ) 开发的 针对蛋白质基本理化性质的分析:
打开protein.txt, 将一条蛋白质序列 粘贴在搜索框中
学习交流PPT
13
计算窗口(7-11) 相对权重值
权重值变化趋势 是否归一化
氨基酸标度
学习交流PPT
14
所用氨基酸 标度信息
分析所用参 数信息
输出结果Leabharlann 学习交流PPT15
图形结果
文本结果
参数
每个位置 的得分
学习交流PPT
16
蛋白质序列分析
– 直接填写Swiss-Prot/TrEMBL AC号(accession number) • 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列
输入Swiss-Prot/TrEMBL AC号
打开protein.txt,
将蛋白质序列
粘贴在搜索框中
学习交流PPT
6
输出结果
• 输入Swiss-Prot/TrEMBL AC号—分不同的功能域肽段 • 以P02699为例
1. 分泌信号肽
2. 脂蛋白信号肽
3. Pilin-like信号肽 4. 细菌素和细菌素信号肽
学习交流PPT
17
蛋白质序列分析
• 信号肽主要由三个domain组成:N-region、Hregin和C-region.
• N-region为正电荷区域,至少含有一个精氨酸(R) 或赖氨酸(K).
• H-region为疏水核,一般长为12~14个氨基酸.
输入序列的FASTA文件
学习交流PPT
20
人的内质网驻留蛋白信号肽预测
曲线颜色
C score: 剪切位点分值 S score: 信号肽分值 Y score: 综合剪切位点分值
此处C值最大;S值陡峭; Y值最高峰。预测为信号 肽剪切位点
文本结果,YES代表该蛋 白包含信号肽,剪切位点 位于29,30残基处
• 推荐使用PSORT()II软件对PDCD5蛋白的细胞内定位进行预测。 PSORT将动物蛋白质定位于10个细胞器:(1)细胞浆,(2)细胞骨架, (3)内质网,(4)胞外,(5)高尔基体,(6)溶酶体,(7)线粒体,(8)胞 核,(9)过氧化物酶体(peroxisome)和(10)细胞膜。
– Protparam 工具
学习交流PPT
4
蛋白质理化性质分析
• Protparam 工具
计算以下物理化学性质: • 相对分子质量 理论 pI 值 • 氨基酸组成 原子组成 • 消光系数 半衰期 • 不稳定系数 脂肪系数 • 总平均亲水性
学习交流PPT
5
主要选项/参数
序列在线提交形式: • 如果分析SWISS-PORT和TrEMBL数据库中序列
蛋白质功能预测 • 掌握基于序列同源性分析的蛋白质功能预测。
学习交流PPT
2
(一)蛋白质基本理化性质分析
蛋白质理化性质是蛋白质研究的基础
蛋白质的基本性质:
• 相对分子质量 • 等电点(PI) • 半衰期 • 总平均亲水性
氨基酸组成 消光系数 不稳定系数 ……
实验方法:
• 相对分子质量的测定、等电点实验、沉降实验 • 缺点:费时、耗资
10
(二)蛋白质疏水性分析
• 疏水作用是蛋白质折叠的主要驱动力 • 分析蛋白质氨基酸亲疏水性是了解蛋白质折叠的
第一步 • 氨基酸疏水分析为蛋白质二级结构预测提供佐证 • 是分析蛋白质跨膜区重要一步
学习交流PPT
11
蛋白质亲疏水性分析
• ProtScale工具
• 氨基酸标度
– 表示氨基酸在某种实验状态下相对其他氨基酸在某些性 质的差异,如疏水性、亲水性等
度
学习交流PPT
12
主要选项/参数
序列在线提交形式: • 如果分析SWISS-PORT和TrEMBL数据库中序列
– 直接填写Swiss-Prot/TrEMBL AC号(accession number) • 如果分析新序列:
– 直接在搜索框中粘贴氨基酸序列 以P02699为例
输入SwissProt/TrEMBL AC号
• C-region包含信号肽酶(SPase)的剪切位点,在剪切 位点的-1位和-3位上多为中性的丙氨酸,该区域 也称为富含丙氨酸区域.
N HC
N端
C
端
学习交流PPT
18
三 信号肽的预测
• 常用工具
• SignaIP()
• 通过神经网络方法的组合 • 预测信号肽的位置及相应切点
学习交流PPT
19
人的内质网驻留蛋白信号肽预测 Q9BS26