当前位置:文档之家› 代谢组学与化学计量学

代谢组学与化学计量学


4. ALS算法
是一种基于双线性的化学计量学方法,X=csT+E,曲线分辨的 目的就是要得到有物理意义的C与S ALS的算法步骤如下: 步骤1确定体系的因子数 步骤2由EFA方法估计初始的浓度初值,用三角形模型估计初始 浓度矩阵。 步骤3运用最小二乘法,根据步骤2中所得的浓度矩阵估计纯光 谱矩阵:S=XTC(CTC)-1
代谢组学的特点
1.全局观点 2.由于代谢组学的研究对象是人体或动物体的所有代谢产 物,而这些代谢产物的产生都是由机体的内源性物质发生反 应生成的,因此,代谢产物的变化也就揭示了内源性物质或 是基因水平的变化,这使研究对象从微观的基因变为宏观的 代谢物,宏观代谢表型的研究使得科学研究的对象范围缩小 而且更加直观,易于理解。 3.基因和蛋白表达的微小变化会在代谢物上得到放大,从而 使检测更容易。 4.研究中采用的技术更通用,这是因为给定的代谢物在每个 组织中都是一样的缘故。 5.对机体损伤小,所得到的信息量大 。
步骤4 将步骤3得到的纯物质光谱矩阵S代替下式 重新估计浓度矩阵:C=Xs(sTs)-1 步骤5 重复步骤3和步骤4,直至两次迭代得到的 矩阵相对失拟度差小于或等于O.1%, 步骤6 结合ETA方法所得信息,对计算所得各组分 浓度和纯物质光谱矩阵进行校正,从而解析得到各 组分的浓度曲线和纯物质光谱曲线。
3 选择性离子分析法(Selective Ion A nalysis,SIA)
运用HELP方法解析重叠色谱峰最主要的特色之一就是充分 利用了选择性区域提供的信息,从而解得具有真实物理意义的 唯一解。找到并确定各组分的选择性区域是HELP方法解析重 叠峰的关键和前提条件。然而,在我们的研究体系中,存在着 某些特殊的严重重叠的色谱峰,我们无法找到其中任何一个组 分的选择性区域。选择性离子分析法可用来解析严重重叠的色 谱峰的方法.
SIA方法的主要思路:
(1)假设某一重叠峰中包含有A个组分,其相应的二维数据矩阵 X可以表示为: X CS t E (2)对于这样一个未知体系,我们可以获得其量测数据X,根据 公式如果能够找到色谱矩阵C,则利用偏最小二乘算法可以很 容易求得相应的质谱矩阵S: S X t C ( C t C ) 1 (3)每个组分的选择性离子为我们提供了解析二维数据的关键 信息。基于选择性离子,可以提取出其相应组分的纯色谱。这 样,只要每个组分存在至少一个选择性离子,就能据此获得色 谱矩阵C,再求得质谱矩阵S。将所得组分i的质谱si与标准质谱 库进行匹配,就可以对其进行定性分析了。同时,分辨所得的 ci可获得组分i的定量信息。
3.然后,按单位时间点移动窗口,构造新的正交投影阵,
计算得新的投影残差矢量长度,重复以上窗口移动及投影 运算直至色谱终点,获得系列的残差矢量的长度re1, re2, re3,……ren. 4.最后,以投影残差长度结合保留时间绘制投影残差曲线。 当在某一段保留时间内,rei的数值接近于零,则样品B含有 的化学成分与α 1所代表的成分相同,反之,样品B缺少该化 学成分。 同理,可以将样品曰作因子分析,向样品A的一系列正 交投影阵作投影运算,可判定A有无曰的化学成分。从而 完成两色谱指纹图谱的比较。
5.投影残差曲线
用来比较两色谱指纹图谱中所含的化学成分异同。计算步 骤如下: 1.扣除A和B的背景后,首先通过子窗口因子分析法,绘制矩阵A 的秩图,将秩图所示A中某一目标指纹峰色谱的选择区数据片断 的矩阵y作奇异值分解,Y=USVT+E; 2.接下从行正交载荷矩阵y中选取第l列矢量α 1,即某一成分的 抽象光谱;而后,按设定的窗口尺寸w自色谱起始时间,沿保留 时间方向,从B中取w行混合光谱子矩阵X1,按正交投影原理, 构造正交投影阵P=1—x1+x1;进而用α 1将矩阵P1投影,获取投影 残差矢量r1=P1α 1,计算矢量的Euclidean模,即投影残差矢量的 长度,re1=‖r1‖2;
运用SIA方法来解析重叠峰可概括为以下几个步骤: (1)基于最小熵原理和/或二维数据质谱方向上的特征投影 图来寻找各组分合适的选择性离子; (2)根据各组分的选择性离子提取相应的色谱信息; (3)运用偏最小二乘原理解得各组分的纯质谱; (4)根据解析所得的各组分的纯色谱和纯质谱对其进行定性 定量分析。
一些方法的补充 1 线性判别分析
线性判别分析(Linear Discriminate Analysis,LDA) 是一种常用的统计分析方法。给定一组变量,线性判别分 析的主要目的是找到一个线性判别函数用于判断样本的类 别,这个函数将使类与类之间的差异尽可能大,而同一类 的不同样品之间的差异尽可能小。 这个函数是各个变量的线性函数: g(x)=w1x1+w2x2⋯wixi+w0 式中xi是X的第i个变量,wi是待定的系数,w0是常数项。求 得了每个变量对应的系数和常数项后也就得到了分类线性 判别函数,这个判别函数通常也称为判别模型,可以用来 对未知样本的类别进行预测。
2 分类特征变量
分类特征变量法(Classified Characteristic Variable, CCV)是一种新的寻找生物标志物的方法,其方法原理如下: 假设有n个偏最小二乘乘潜变量(LVs)用于建立线性判别 模型,则判别模型的方程可以表示为:
altl+a2t2+a3t3⋯antn=c
tl,t2,...tn为PLS分解得到的前n个潜变量(LVs),仅l, a2⋯.仅n是判别模型方程的系数,C是常数。 由PLS的潜变量(LVs)表达的判别模型的方程转换为用原 始变量表达 Xβ =c 在这个转换方程中,系数β 的绝对值能够反应每个变量 对于样本的分类的贡献。也就是说,对应于贡献较大的变量 的化学成分很可能是我们要寻找的生物标志物。
代谢组学的概念及发展
代谢组学最初是由英国帝国理工大学Jeremy Nicholson 教授提出的,他认为代谢组学是将人体作为一个完整的系统,将 机体的生理病理过程作为一个动态的系统来研究,并且将代谢 组学定义为生物体对病理生理或基因修饰等刺激产生的代谢物 质动态应答的定量测定。 2000年,德国马普所的Fiehn等提出metabolomics的概念, 他将代谢组学定位为一个静态的过程,也可以称为“代谢物组 学”,即对限定条件下的特定生物样品中所有代谢产物的定性 定量分析。
科学家们对代谢组学这一概念也进行了完善,作出了科 学的定义:metabonomics/metabolomics是对一个生物系统的 细胞在给定时间和条件下所有小分子代谢物质的定性定量分 析,从而定量描述生物内源性代谢物质的整体及其对内因和外 因变化应答规律的科学。 代谢组学作为一门新发展的技术,它是通过考察生物 体系受刺激或扰动后(如将某个特定的基因变异或环境变化后) 其代谢产物的变化或其随时间的变化,来研究生物体系的代 谢途径的一种技术;它所关注的是相对分子质量为1000以下 的小分子。
7. 模差渐进 避免了窗口设置及迭代转换等复杂的技术步骤,程 序简单,计算快速,可用于二维重叠色谱的多元分 辨分析。
6. SIMPLISMA 法
SIMPLISMA法基于光谱矩阵中纯光谱之间差异最大的原理,从 测量光谱矩阵中找出差异最大的光谱作为各组分纯光谱。计算步 骤为: (1)求测量矩阵中各光谱si与平均光谱sm之 间的差异di,令di=det(YiTYi),di最大的PH点的光谱为某组分的纯光 谱s1; (2)将步骤(1)求到的纯光谱s1 代替Yi中的Sm求di,di最大点的光谱为另一组分纯光谱S2; (3)将步骤(2)求到的纯光谱S2加入到Yi中求di,di最大点的 光谱为另一组分的纯光谱S3; (4)重复步骤(3)直到所求的di接近噪声水平,得到的纯光谱 的数目即为组分数; EFA 和SIMPLISMA 结合ALS用于解析光谱滴定数据,能正 确分辨出实验体系中各组分的分布曲线.
代谢组学的应用
代谢组学应用领域大致可以分为以下6个方面: (1)植物代谢组学研究; (2)疾病诊断; (3)药物研发; (4)微生物领域; (5)食品及营养学;
(6)在中药现代化及其机理上的研究。
疾病诊断
由于机体的病理变化,使得机体的 代谢产物也产生了某种相应的变化。对 这些由疾病引起的代谢产物的响应进行 分析,即代谢组学分析,能够帮助人们更 好的理解病变过程及机体内物质的代谢 途径,有助于疾病的生物标记物的发现 和辅助临床诊断的目的。
方程g(x)=O定义了一个变量空间中的判别超平面, 它能在变量空间中把不同类的样本对应的点分开。 在多维空间里,它是判别超平面;在三维空间里, 它是区分界面;在二维空间里,它退化成区分界线; 在一维空间里,它退化成区分点。
偏最小二乘线性判别分析(PLs—LDA)是偏最小二乘与 线性判别分析的结合,即先用偏最小二乘法对原始数据进 行降维,并得到新的变量——得分矢量,然后再对得分矢 量进行线性判别分析,得到分类判别函数进而建立判别模 型。 主成分分析一线性判别分析(PCA· LD∞与PLS-LDA的不 同之处在于,是采用主成分分析法对原始数据进行降维得 到得分矢量。
目前用于代谢产物分离、检测、鉴 定的技术主要包括核磁共振光谱法、 傅立叶变换红外光谱、质谱联合分离 检测技术。
代谢组学及化学计量学
代谢组学的研究过程一般包括代谢组数据的采集、数据预处理、 多变量数据分析、标记物识别和途径分析等步骤。 首先,采集生物样品(如尿液、血液、组织、细胞和培养液 等) ,对其进行生物反应灭活、预处理。再运用先进的分析手段 如核磁共振、质谱或色谱等检测样品中所有代谢物的种类、含 量、状态,从而得到原始的大量的反映生物样品信息的实验数据。 然后使用多变量数据分析方法对获得的多维复杂数据进行降维 和信息挖掘,从这些复杂大量的信息中筛选出最主要的最能反映 代谢物变化的主要成分,再通过模式识别将其与标准的代谢物谱 进行比对,或是根据代谢物谱在时程上的变化来寻找生物标记物, 研究相关代谢物变化涉及的代谢途径和变化规律,以阐述生物体 对相应刺激的响应机制。
相关主题