当前位置:文档之家› 蛋白质组学数据分析

蛋白质组学数据分析


71.08
156.19 114.10 115.09
103.14 129.12
Glutamine
Glu or Gln Glycine Histidine
Q
Z G H
128.13
具体数值,对应后页中离子质量
蛋白质组学质谱分析背景介绍
蛋白质组学质谱分析背景介绍
蛋白质组学质谱分析背景介绍
目前人类已知蛋白大约有6万8千种 平均每种蛋白长度为500个氨基酸 平均每种蛋白可以胰切成50个肽段 平均每个肽段有10种可能打碎情况 每一种可能情况产生1张理论图谱 平均一次质谱实验有3000次扫描 每一次扫描产生1张质谱谱图 ???面对如此多的质谱谱图和理论图 谱我们将如何进行比对
选择程序X!Tandem 选择需要搜索的质谱 数据
DTA, PKL, MGF, mzData, mzXML or Tandem BIOML
选择数据库 数据检索输出阈 值
二级谱中片段离 子理论与实际差 异最大允许值
一级谱中片段离 子理论与实际差 异最大允许值
(|M-M0|/M0)X106(ppm) M为离子质量的实测值; M0为离子质量的理论值;
程序运行界面
2.由.out文件整合成pepXML文件
点击“Analysis Pipeline”, 然后点击pepXML,出现如图所示的界面。
选择需要转换成pepXML的.out 文件夹
提交sequest检索时所用参数文件
选择所有文件夹
选择sequest的参数文件
其他参数选择默认,点击Convert to PepXML,即可以将文件夹中 的所有.out文件整合成pepXML文件
X!Tandem
优点:
• 运算速度快
Master node
• 免费,并行集群计算成本低
• 开源可自行修改代码
Network switching
缺点:
• 应用范围尚不广泛 • 后期统计置即可胜任小规模数据检索
Slave nodes
蛋白质组学数据库检索软件
Download GPM Cyclone XE:
蛋白质组学数据统计分析软件
Trans-Proteomics Pipeline (TPP)
蛋白质组学数据统计分析软件
Trans-Proteomic Pipeline (TPP)是用于 LC/MS/MS蛋白质组学数据分析的软件. TPP包含一系列蛋白质鉴定和定量分 析的模块, 能够对经Sequest数据库搜索 引擎得到的结果进行筛选过滤,从而达到 蛋白质鉴定和测序的目的.
操作流程
1. 将质谱RAW文件转换成mzXML文件 ; 2. 以Sequest结果文件和参数文件转换成xml文 件; 3. 运行PeptideProphet,得到pepXML文件; 4. 以上步得到的pepXML文件运行 ProteinProphet,得到最终结果;
1.将RAW转换成mzXML文件
Tandem MS
m/z:质量电荷比
蛋白质组学质谱分析背景介绍
http://www.expasy.ch/tools/peptidecutter/
粘贴蛋白序列:PGYRNNVVN TMRLWSAKAPNDFNLKDFNVG 点击Perform 选择“Only the following selection of enzymes and chemicals”,并选择胰酶Trypsin酶切
蛋白质组学数据库检索软件 GPM(X!tandem)
蛋白质组学数据库检索软件
GPM(X!tandem)
类型 数据输入 免费开源软件
SEQUEST
商业软件
Mascot
商业软件
DTA,PKL,MGF , RAW,DTA mzXML,mzDATA 快 较慢
MGF,DTA
速度
较慢
蛋白质组学数据库检索软件
蛋白质组学质谱分析背景介绍
APNDFNLK
肽段离子碎片示意图
蛋白质组学质谱分析背景介绍
v
1letter code A
R N D B C E
Isoleucine Average mass Leucine Lysine Methionine Phenylalanine Proline Serine Threonine Selenocysteine Tryptophan 57.05 137.14 Tyrosine Valine
PTPEGDLEILLQK : p = 0.81 TPEVDDEALEK : p = 0.96
LSFNPTQLEEQCHI : p = 0.65
P = 1 – (1-0.81)(1-0.96)(1-0.65) = 0.99
TPP的安装与配置
从/projects/sashimi/files/TransProteomic%20Pipeline%20%28TPP%29/TPP%20v4 .7%20%28polar%20vortex%29%20rev%201/上下
程序运行界面
3.运行PeptideProphet
点击Analysis Pipeline,选择Analyze Peptides
选择所有需要运行PeptideProphet的pepXML文件
选择RUN PeptideProphet,其他参数为默认.
运行PeptideProphet的 结果可通过IE打开.
I L K M F P S T U W Y V
113.16 113.16 128.17 131.19 147.18 97.12 87.08 101.10 150.03 186.21 163.18 99.13
Alanine
Arginine Asparagine Aspartic acid Asn or Asp Cysteine Glutamic acid
PeptideProphet分析
在pick columns选项中选中xcorr、 deltcan、sprank三个sequest的参 数,选择Update Page 在IE中打开的PeptideProphet的结果
4.运行ProteinProphet
点击,添加文件
点击Analysis Pipeline,选择Analyze Proteins
安装完后,桌面上生成了TPP图标
使用TPP
点击桌面上的 TPP Web Tools ,将会出现TPP的登陆界面.
UserName: guest Password: guest
TPP Web Interface的欢迎界面
样本数据分析
准备工作: 1. 确保C盘至少1G的空闲的硬盘空间. 2. 将数据文件ZCNI_No1(含.dta和.out文件)至 ZCNI_No6和质谱RAW文件ZCNI_No1.RAW 至ZCNI_No6.RAW,以及Sequest参数文件 sequest.param放到目录: C:\Inetpub\wwwroot\ISB\data\ZCNI_training 下 3. 将数据库文件ipi.HUMAN.fasta放到目录: C: \database中
(练习文件为肝癌蛋白质组学数据)
2. 编辑参数
3. 运行 GPM中的X!Tandem 4. 查看结果 5. 使用自己的数据库
1. 将 *.raw 文件转变为 *.mzXML 文件
开始>运行>输入“cmd” 开启命令行窗口
Download:/project/sashimi/ReAdW%20%
实习5:蛋白质组学数据分析
邱庆崇 刘 杰 李 超 刘 振
系统生物学平台 浙江加州国际纳米技术研究院(ZCNI)
课程内容:
1.蛋白质组学质谱分析背景介绍
2.蛋白质组学数据库检索软件 GPM(X!tandem)
3.蛋白质组学数据统计分析软件TPP
蛋白质组学质谱分析背景介绍
蛋白质组学质谱分析背景介绍
选择经PeptideProphet后生成的 Interact.pep.xml文件
• 其他为默认,点击Run ProteinProphet!
其它参数为默认,点击Run ProteinProphet,即可运行ProteinProphet程序
运行ProteinProphet完成后生 成的interact-prot.shtml 文件可由IE打开.
ftp:///projects/gpm/gpm-xe-installer/
蛋白质组学数据库检索软件
解压缩:
数据库、结果 程序等核心内容
运行程序
质谱原始数据
蛋白质组学数据库检索软件
数据库
参数
输出结果目录
蛋白质组学数据库检索软件
工作流程:
1. 将 *.raw 文件转变为 *.mzXML 文件
蛋白质组学数据统计分析软件
Trans-Proteomic Pipeline
蛋白质组学数据统计分析软件
蛋白质组学数据统计分析软件
>sp|P02754|LACB_BOVIN BETA-LACTOGLOBULIN PRECURSOR (BETA-LG) (ALLERGEN BOS D 5) - Bos taurus (Bovine). MKCLLLALALTCGAQALIVTQTMKGLDIQKVAGTWYSLAMAASDISLLDA QSAPLRVYVEELKPTPEGDLEILLQKWENGECAQKKIIAEKTKIPAVFKIDA LNENKLVLDTDYKKYLLFCMENSAEPEQSLACQCLVRTPEVDDEALEKFDK ALKALPMHIRLSFNPTQLEEQCHI
• 点击Analysis Pipeline选择mzXL/mzMXL,在Input File Format中选择 Thermo Raw,在Specify File to convert to mzXML中添加RAW文件
选择目录 ZCNI_training
相关主题