蛋白质组定量数据分析
蛋白质组定量数据分析
张磊 复旦大学IBS技术平台
zhanglei123@
•质谱数据检索鉴定
第一节
•质谱数据定量分析流程
第二节
•蛋白质组大队列定量技术
第三节
背景
采集分子量,碎裂,采集 强度
结果:质荷比,强度,色 谱保留时间
质谱数据检索鉴定
样品 准备
质谱 分析
数据 检索
谱图文本文件
起始格式
质谱文件信息 谱图编号 保留时间
肽段电荷数 肽段质荷比 碎片峰,强度
一张谱图如何准确鉴定
基于理论数据
N张谱图如何准确库的鉴检定索方法
基于谱图库的 检索方法
基于Tag技术 的优化检索方 法
蛋白质理论数据库
RefSeq—The National Center for Biotechnology Information Reference Sequence (NCBI RefSeq) database
获得蛋白峰面积信息
非标定量相关算法
DIA/SWATH数据处理
DIA方法优势
目标检索和非目标检索两种分析方法
分馏分,建 立巨大的谱 图库
根据肽段 保留时间 和分子量 强行提取, 打分,定 量
非目标检索流程图
RAW文件开 始
特征提取
RTALIGNMENT
MS1-MS2 GROUP
Database search
159病人(33 组)
Proteomics reveals NNMT as a master metabolic regulator of cancer-associated fibroblasts
Nature 2019
Integrated Proteogenomic
Cell
Characterization of HBV-Related Hepatocellular Carcinoma
PEAKS
可用于检索未知肽段
Open-pFind 开放式 搜索算法,一次检索 500+可变修饰
质量控制 统计方法
混合模型估计FDR
各种算法
谱图预处理
母离子,电荷校正
修饰位点FDR卡值
数据库问题 。。。
常用检索软件和数据库
蛋白质组数据定量过程
基于MS1的定量分析流程 基于MS2的定量分析流程 非标记定量分析流程
Cancel Cell 2019
鉴定规模
总6944 平均4942,4428
定量规模 无
10783蛋白(2), 6494(全)
平均8934,9224pho,26418(一
59746位点
半)
8067蛋白,
6422, 7295pho 位点
9625蛋白,
无
28944pho,
4376N-gly
组织 组织 组织
Multi-level Proteomics Identifies Cell
CT45 as a Chemosensitivity
无馏分 250min 300+
质控方法 1.如何保证仪器长时间稳定? 2.不同组别标记定量如何规整?
不同组别标记定量如何规整?
制作混合样本,每组标记定量样本留一个 Refrence通道,添加制作的混合样本
期刊 Nature 2019
Cell 2019
组织
Proteogenomic Analysis of Human
Cell
Colon Cancer Reveals New Therapeutic Opportunities
2019
组织
Proteogenomic Characterization of Human Early-Onset Gastric Cancer
Nature 2019
Integrated Proteogenomic
Cell
Characterization of HBV-Related Hepatocellular Carcinoma
2019
与mRNA测序 DTARefinery 结果做相关性 MSGF+ 分布,火山图 Ascore (FDR0.05)
IBAQ,LFQ (2014 MCP) DIA/SWATH
谱图计数 法灵敏度 低
传统非标记定量
保留时间校准和色谱 峰对齐
峰面积优化定量
保留时间校准 动态规划算法
高斯滤波算法应用于色谱峰优化
高斯模板
原函数
高斯模板
传统非标记定量软件推荐
Maxquant https:///
UniProt—The UniProt Consortium consists of research teams from the European Bioinformatics Institute (EBI)
基于理论数据库的检索方法
基于谱图库的检索方法
常用谱图匹配公式
基于Tag技术的优化检索方法
Proteomics reveals NNMT as a master metabolic regulator of cancerassociated fibroblasts
组织
Integrated Proteogenomic Characterization of HBV-Related Hepatocellular Carcinoma
The Proteogenomic Landscape of Curable Prostate Cancer
Proteomics identifies new therapeutic targets of early-stage hepatocellular carcinoma
Multi-level Proteomics Identifies CT45 as a Chemosensitivity Mediator and
2019
工 作 量
非标定量 TMT标记
四标ITRAQ P/N
110个病人 80个病人
Proteogenomic Analysis of Human Colon Cancer Reveals New Therapeutic Opportunities
Cell 2019
Proteogenomic Characterization Cancer Cell
Cancer Cell 2019
Nature 2019
馏分情况 色谱时间 总花费机 器时间
无馏分 250min 500h+
24
70min 2000h+
6个馏分 100min 1000h+
12-24 180min 1000h+
无馏分 240min 500h+
3-6
90min 1000h+
非标定量
25个病人
Kmean s聚类
计算相关系数, 按系数从大到 小取峰
DIA定量软件推荐
DIA相关软 件算法
iFree定量软件
Comet检索软件
速度:200S 定量2个360min梯度 4000条糖肽
从定量数据到差异蛋白列表
蛋
定量信息
白
信
息
样品信息,分组信息
缺失值 处理
样本过 滤
数据归一化 数据转换 尺度化
二是建立疾病或者研究主题的表达谱、分子机制和潜在靶点。这种研究思路在于通过检测病 理样本与正常样本间的蛋白表达差异或动态变化过程,寻找疾病相关的关键因子,再结合进 一步的机制研究,揭示关键因子的调控机制,全面的了解疾病的发生发展过程。
方法
样本量
文章标题
期刊
非标定量
TMT标记 (11通道)P
107个样本
获得蛋白比值
基于MS1的定量分析流程 基于MS2的定量分析流程 非标记定量分析流程
蛋白质组学定量技术
SRM
靶向
通量低
MRM
非靶向
非标记定量 标记定量
谱图计数
强度面积
化学标记 代谢标记 酶促标记 组合标记
PAI (2005 MCP) APEX (2008 Bioinformatics) SIN (2010 NBT)
Cell
检索质控 位点质控 空值处理
双百分之 无 1
MBR, Perseus
双百分之 Localliza 50%,
1
tion 0.75 KNN(R)
双百分之 Ascore 无 1
双百分之 Unique 无
1
Mass
class(20
14)
双百分之 无 1
双百分之 无 1
50%,,最 后百分之1, 做分布
Cell 2019
Proteogenomic Characterization Cancel Cell
of Human Early-Onset Gastric Cancer
2019
The Proteogenomic Landscape of Curable Prostate Cancer
Cancel Cell 2019
比值
质荷比 强度 保留时间
MS1标记定量软件推荐
Maxquant
https:///
获得蛋白比值
基于MS1的定量分析流程 基于MS2的定量分析流程 非标记定量分析流程
注意问题
同位素效应校准
从谱图比值到蛋白比值
MS2标记定量软件推荐
Maxquant
https:///
如何质控
取了10对样品,分馏分储存,每四组样品之间做一次质控TMT样本
如何长时间质控
检 索 和 差 异 蛋 白 筛 选
差异筛选
检索软件
火山图
Maxquant