文献31 代谢组学的发展历史和精髓代谢是生命活动中所有(生物)化学变化的总称。
代谢活动是生命活动的本质特征和物质基础。
因此,对代谢物的分析向来就是研究生命活动分子基础的一个重要突破口。
生物代谢的系统化科学研究始于18世纪末到19世纪早中期,经过半个多世纪的努力,人们对代谢活动的物质基础和化学本质有了较为详尽的认识。
这些科学研究均以经典“还原论”为研究哲学基础,对代谢途径或者其中的某些环节进行了“各个击破”的详尽研究,充分认识了各代谢途径或环节的分子机理。
然而,孤立的代谢途径或环节是不存在的。
伴随着21世纪的来临,对生物体系的认识需要从整体(或系统)水平进行,随之而诞生了系统生物学的思想。
这种研究哲学的转变引发了近两百种所谓“组”和“组学”思想和概念的出现。
所谓代谢组是指生物体内源性代谢物质的动态整体。
然而,传统的代谢概念既包括生物合成也包括生物分解,因此理论上代谢物包括核酸、蛋白质、脂类以及其他小分子代谢物质。
但为了有别于基因组、转录组和蛋白质组,代谢组目前只涉及相对分子质量约小于1000的小分子代谢物质。
代谢组学是关于生物体内源性代谢物质的整体及其变化规律的科学。
代谢组学的中心任务包括检测、量化和编录生物内源性代谢物质的整体及其变化规律,联系该变化规律与所发生的生物学事件或过程的本质。
在基因组学、转录组学和蛋白质组学等概念存在的同时,为什么还需要代谢组学的概念呢?首先,这是因为对生物体系而言,基因、转录子和蛋白质的存在为某生物学事件或过程的发生奠定了物质基础,但这个事件或过程有可能不发生;而代谢物的存在反映生命过程中己经发生了的生物化学反应,其变化正是对该生物事件或过程的反映。
其次,绝大多数生物由宿主和与之共进化而共生的客体共同组成,是所谓的超级生物体。
譬如,一个健康的人体由人体和与之共生的菌群两部分组成。
因此,研究人体显然需要对人本身、菌群及其相互作用等在系统水平对所发生的生物事件进行整体性认识。
但是,体内菌群中菌种繁多而且多数暂时无法进行体外培养,对这个共生体仅仅从基因组和蛋白质组水平进行研究,有必然的困难和方法上的不足。
况且仅肠道菌群的细胞数量和基因组规模均至少为人体的10倍!因此,仅仅研究宿主本身的基因或细胞,最多只能认识正常人体的一小部分。
而人体的整体代谢活动包括宿主机体本身的代谢、寄生菌群的代谢、两者的共代谢以及两者代谢物质交换引起的变化,建立这些生命活动的相互联系才可能完成所谓“系统水平的认识”。
尿液和血液代谢组包含了人体内每一个细胞的代谢信息(包括宿主和菌群),也包含了宿主和菌群代谢活动的相互作用,人体尿液和血液代谢组也携带着宿主和菌群基因组成、调控和表达状态,以及蛋白质功能体现等等信息。
因而,对该系统代谢组的分析也是对基因组、转录组和蛋白质组水平研究生物系统的一个重要补充。
事实上,近来人们己经使用代谢组学方法研究宿主和菌群代谢的相互作用,证实了其可行性,而且已逐渐成为一个引人注目的研究热点。
如今,以代谢组学为基础的全局系统生物学(globalsystemsbiology)思想已经诞生而且正处于快速发展阶段。
文献8代谢组学技术的原理代谢组学利用波谱或光谱学方法对生物体液及组织中的代谢产物进行监测,将所得数据通过多元统计分析和模式识别方法进行分析,了解由外源性物质和药物的作用而引起的内源性代谢产物的变化,并将这种变化与核磁共振谱或质谱的谱图模式对应起来,从而找出外源性物质作用的靶器官和作用位点,进而确定与之相关的生物标记物,确定药物或毒物作用机制,进行毒性分类和筛选文献21 代谢组学的研究技术和方法先进的分析检测技术结合模式识别和专家系统等计算分析方法是代谢组学研究的基本方法。
完整的代谢组学分析的流程包括样品的制备、样品分析和数据的解析。
样品的制备包括样品的采集和预处理。
与原有的各种组学技术只分析特定类型的化合物不同,代谢组学所分析的对象的大小、数量、官能团、挥发性、带电性、电迁移率、极性等物理化学参数差异很大,要对它们进行无偏向的全面分析,单一的分离分析手段难以胜任。
核磁共振(NMR)、色谱-质谱联用等是最常用的分析方法,这2种方法各具特点,互为补充。
NMR[’一‘,s一’OJ具有不破坏样品的显著特点,同时没有偏向性,对所有化合物的灵敏度相同,且可提供化合物的结构信息;近年随着电喷雾等软电力技术的出现,质谱越来越多地应用于多肤和蛋白等生物样本分析中〔’‘一’礴〕。
同样,质谱也适用于生物小分子的分析,特别是气一质联用(GC/MS)、液一质联用(LC/MS)和电泳一质谱联用(CE/MS)等联用技术,是对代谢物逐一定性定量时不可缺少的手段,而且在进行相对分子质量测定及分子式推算时,质谱是无可取代的。
另外红外光谱、库仑分析、紫外吸收、荧光散射、发射性检测、光散射等分离分析手段及其组合都出现在代谢组学的研究中;面对大量、多维的数据信息,如何计算处理,充分抽提所获得的数据中的潜在信息,是代谢组学研究的重要内容。
对数据的分析需要应用一系列的化学计量学方法。
主成分分析(PCA)将高维数据降维,并将数据投影变换到变异最大的主轴上,从而提取出数据集的特征,这种方法简便易懂,是目前代谢组数据处理的主要方法〔‘2一’4〕。
神经网络等智能分类算法也被应用于代谢物组数据处理中[8]。
还有研究者应用统计实验设计和偏最小二乘法对代谢物组分析信号进行处理〔”〕,或用层次聚类分析和K一最近邻的方法对19种毒性物质的NMR分析数据分类,成功地分辨了空白组、肝毒性组、肾毒性组和其他作用组〔’‘了,根据不同的数据类型和研究目标,代谢组学可以采用各种模式识别/多元统计分析技术和方法〔‘]。
文献32 代谢组学的研究方法体液中的代谢物质与细胞、组织和整体水平的生物化学状态密切相关。
正常状态下机体中的代谢物组成处在一个动态的平衡当中。
当机体受到毒性物质、代谢障碍或者生理因素的影响时,在细胞、组织,甚至整体水平会发生代谢的变化应答,导致代谢物种类和浓度的变化。
出现异常时,生物体液的组成就会产生变化。
代谢组学就是通过检测代谢物水平的整体和动态变化,提取相关的生物代谢标志物群体或标志物簇(biomarker。
lusters),在此基础上寻找所受影响的相关代谢途径或环节,从中上推寻找相关蛋白质组的对应变化,确立代谢网络调控机制,进而联系和认识转录组与相关的调控基因功育旨。
代谢物整体水平的检测分析:必须依赖分析化学中的各种谱学技术,包括磁共振波谱、质谱、色谱、红外和拉曼光谱、紫外—可见光谱等及其偶合联仪方法获取代谢组数据;利用分析化学中的化学计量学或化学信息学的研究方法将数据进行统计和归类分析,从而提取代谢特征或代谢时空的整体变化轨迹。
因此,分析化学在代谢组学研究中具有基础性的重要作用。
需要特别指出的是,代谢组学属于整体认识的思想,所强调的代谢特征或代谢时空整体变化,不是传统意义上的某种代谢物或少数几种代谢物含量和存在方式的变化,因此,常常需要采用多变量统计分析方法。
另外,通过代谢组变化获取的“生物标志物簇”也只是代谢组学研究的一个初级阶段性目标,而建立代谢特征或代谢时空变化规律与生物体特性变化之间的有机联系,才是代谢组学研究的根本目标。
面对如此繁多的分析检测方法,实际研究工作中如何进行选择呢?回答这个问题就必须对分析方法的优缺点进行系统分析。
对于代谢组这样复杂的系统,理想的检测分析方法必须具备同步检测的无偏向性、不依赖检测者的客观性、良好的分辨率和重现性、高灵敏度和系统或整体性、分子结构信息的丰富性和原位定量研究的可行性、样品制备的简易性和高通量分析可操作性、较低的先验性、知识依赖性、活体或原位检测分析的可能性和便捷性、劳动力低耗性、重复回头检测率低、较低的每个样品检测分析成本,等等。
现有的分析方法基本上可以归为三类:色谱-质谱联仪方法、磁共振波谱法和色谱-核磁-质谱联仪法。
色质联仪法总体来说具有良好的客观性和分辨率,一次性仪器购置投资相对较少,但该方法属于有偏向选择性检测方法,需要对样品有介入性和破坏性而不利于在体和原位分析;需要对样品进行较为复杂的制备而通量有限;对代谢组中各代谢物的原位定量十分繁琐;未知代谢物的定性(结构确定)有相当的难度。
目前从重现性等角度看,超高效液相色谱-质谱和气相色谱-质谱方法有一定的优势。
随着方法学的发展,该方法应该还会有较大的改进空间。
其中,色谱的分辨率和色谱柱进样前后的稳定性或重现性、质谱中对不同代谢物质的离子化效率以及离子化抑制问题对代谢物定量的影响,以及未知代谢物定性(确定结构)等方面问题,都亟待解决。
磁共振波谱法的优点包括:良好的客观性和重现性,因而便于不同实验室之间数据的交换和比较;样品不需要繁琐处理,可在接近生理条件下进行实验;具有无创性,不破坏样品的结构和性质,因而便于活体、原位的动态检测;代谢组中代谢物质的响应系数相同,因此可以进行一次性同步、无偏向的检测而且具有良好的原位定量效果;检测具有优异的重现性,其信号携带着原子之间连接关系、动力学性质和相互作用等丰富的分子信息,便于确定未知代谢物质的结构和性质;可以对细胞和组织等进行原位无创的检测分析而不受样品具体形态的限而且具有较高的通量和较低的单位样品检测成但它的缺点是检测灵敏度相对较低,采用现有制本成熟的超低温探头技术,其检测灵敏度在纳克级水平;另外仪器购置的一次性投入费用扬大。
上述分析不难看出,理想的代谢组分析技术应当是色谱- 超低温核磁-质谱的结合。
近来,STOCSY思想的诞生和方法学突破,使“波谱集成理论”和相应的方法方面取得了长足进步,不仅为疾病和毒理相关的代谢途径相关性建立了研究方法,为系统生物学中转录组、蛋白质组和代谢组的整合提供了重要方法,解决了分子流行病学研究中药物服用的调查准确性问题,也为色谱-超低温核磁-质谱的有效结合奠定了基础。
用于代谢组数据分析处理的化学计量学方法很多,但大体包括两类:非指导性(unsupervised)和指导性(supervised)方法。
最常见的非指导胜方法为主成分分析(principalcomponentanalysis,PCA),最常见的指导性方法为偏最小二乘法为基础的分析(partial least square,PLS)。
这两种方法常常以所谓的scoresplot和loadingsplot的形式输出分析结果,前者表征对比代谢组之间的区别和相似程度;而后者给出导致其区别(或相似性)的有贡献变量及其贡献程度。
这些变量可以是核磁谱中的化学位移(即代谢物质)、色谱中的保留时间(代谢物或其色谱特性)、质谱中的质荷比(分子量或其分数)。
PCA在不作任何介入和无任何假设的前提下给出待分析各代谢组的内在区别,而PLS则有一定的假设。
对这些方法,尤其是指导性方法的选择都是有一定条件的,也正因为如此,使用指导性分析方法时要格外注意假设的基础和成立性。