当前位置:文档之家› 复杂性状疾病的系统生物学研究

复杂性状疾病的系统生物学研究

文章编号:1001 6325(2005)01 011 05短篇综述 为了使广大读者了解、跟踪医学科学各学科前沿的快速发展,我刊自2005年推出 短篇综述专栏,及时发表对国内外医学研究发展中涌现的新概念、新趋势、新进展所做的短篇、精捍的综述,欢迎广大读者积极投稿。

复杂性状疾病的系统生物学研究王林杰,高友鹤(中国医学科学院中国协和医科大学蛋白质组学研究中心,北京100005)摘要:复杂性状疾病,即多基因病,其发生发展是基因,蛋白质,代谢分子,环境等众多因素相互作用的结果,仅仅从基因或蛋白等单层次研究已不能解释其发病规律。

系统生物学的出现为从整体出发研究复杂性状疾病提供了新的视角和机会。

本文主要介绍系统生物学概况和在复杂性状疾病研究中的应用。

关键词:复杂性状疾病;系统生物学中图分类号:R596 3 文献标识码:A复杂性状疾病(complex disease),即多基因病(polygenic disorder),是指由多个基因位点共同参与,且和环境因素相互作用决定表型的遗传病[1],如高血压、冠心病、糖尿病、哮喘和某些癌症等。

由于这些疾病在当今社会已成为危害人类健康的最大杀手,因此复杂性状疾病的研究已成为现代生物学的热点之一。

与单基因疾病相比,复杂性状疾病有许多不同之处,如高度的遗传变异性、基因微效性、数量遗传性状、高度的环境相关性等。

越来越多的实验证据证明基因与环境之间的相互作用在复杂疾病的发生发展过程中起着关键性作用,它们之间的相互作用是极其复杂和非线性的,一个相同的基因在不同的环境中会产生不同甚至是完全相反的表型[2],因此单纯从基因或蛋白等某一个角度去研究是不足以全面了解复杂性状疾病的发生、发展过程的。

而着手于整体,全面观察疾病发生发展过程中在基因、蛋白和代谢等各个水平上的变化及细胞内的反应途径及网络甚至整个生物体的异常,综合分析所得结果,可能会为揭示复杂性状疾病的发病规律提供新的思路。

早在1969年,Bertalanffy LV就提出了一般系统理论(General Syste ms Theory),他在文章中指出生物体是一个开放系统,对其组成及生物学功能的深入研究最终需要借助于计算机和工程学等其他分支学科结合才能完成[3]。

1999年,由Leroy Hood创立的系统生物学(Systems Biology)则是在以还原论为主流的现代生物学中反其道而行之,把这种以整体为研究对象的概念重新提出,由于目前的生物技术等诸多因素限制,系统生物学仍处于相当初级的起步阶段,但它的出现仍得到了生物界广泛关注。

本文将对系统生物学这门新兴学科以及它在对复杂性状疾病的研究上的应用做简单介绍。

1 系统生物学的概念根据Leroy Hood的定义,系统生物学是研究一个生物系统中所有组成成分(基因、mRNA、蛋白质等)的构成,以及在特定条件,如遗传的、环境的因素变化时,分析这些组分间相互关系的学科。

同时,通过整合各组成成分的信息,以图画或数学方法建立能描述系统结构和行为的模型。

这里所说的系统可以是(1)执行相同功能的一组蛋白质分子,如参与半乳糖代谢的酶;(2)由一系列蛋白质和其他分子组成2005年 1月第25卷 第1期基础医学与临床Basic&Clinical MedicineJanuary2005Vol.25 No.1收稿日期:2004-09-03的细胞器,如核糖体;(3)复杂的蛋白质网络,如参与细胞骨架形成的蛋白网络;(4)执行某一特殊功能的单个细胞或一组细胞等。

因此一个生物系统可包括分子,细胞,器官,个体,人群甚至是整个生态系统[4,5]。

也就是说,系统生物学不同于以还原论为核心的生物学-仅着手于个别的基因和蛋白质,它同时研究许多水平上,如基因、蛋白质、代谢物、信息通路以及信息网络等复杂的相互作用,从而理解它们如何共同发挥作用。

所以说,系统生物学是以整体为研究对象的一门学科。

2 系统生物学的产生背景人类基因组计划不仅提供了大量的数据,同时还让科学家从全面的、系统的角度考虑生物学的问题。

同时,随着生物学是一门信息科学的概念得到广泛认同,交叉学科在生物学界的出现促使生物学家、化学家、计算机学家、工程师、数学家及物理学家等共同投身于对全新的生物技术、整合软件及算法的开发和应用中来,产生出新的高通量的基因组学、蛋白质组学和代谢组学技术平台[4]。

3 系统生物学的研究思路及特点系统生物学的研究由假设开始,综合以往基因、生化等水平的研究建立初始模型,改变条件影响系统,如利用基因(如突变或过表达)、药理或环境操纵等手段干扰模型的各个途径的组成成分并同时全面收集系统各元素的动态信息,包括基因表达、蛋白质表达和相互作用、代谢途径等的变化,通过整合数据,分析比较调整模型,再实验,再调整,直到实验数据和模型基本相符,并提出模型未能预测的新假设并反复试验,从而得到更多更丰富的信息。

系统生物学的目标就是要得到一个理想的模型,使其理论预测能够反映出生物系统的真实性,并能通过再设计或干扰(如某种药物)赋予该模型新的特性[4~6]。

系统生物学最大的特点即整合。

系统学认为整体大于部分之和。

这里的整合主要包括三重含义。

首先,把系统内不同性质的构成要素(DNA、mRNA、蛋白质、生物小分子等)整合在一起进行研究;其次,对于多细胞生物,系统生物学要实现从基因到细胞、到器官、到组织甚至是个体的各个层次的整合。

第三,研究思路和方法的整合;经典的分子生物学研究是一种垂直型的研究,即采用多种手段研究个别的基因和蛋白质。

而基因组学、蛋白质组学和其他各种!组学∀则是水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。

而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种!三维∀的研究[7]。

系统生物学最重要的研究手段是干涉(perturba tion)。

系统生物学的发展正是由于对生物系统的干扰手段不断进步促成的。

例如基因操作技术较从前相比已经实现了高通量、自动化、标准化。

一些反向作用于基因的技术已逐渐成熟,如RNAi技术,使得干扰手段可以最大范围的应用于对真核生物的研究中[8]。

干涉主要分为从上到下(top-down)或从下到上(bottom up)两种。

从上到下,即由外至里,主要指在系统内添加新的元素,观察系统变化。

例如,在系统中增加一个新的分子以阻断某一反应通路。

而从下到上,即由内到外,主要是改变系统内部结构的某些特征,从而改变整个系统,如利用基因敲除,改变在信号传导通路中起重要作用的蛋白质的转录和翻译水平[6]。

4 系统生物学的应用以系统生物学发表的第一篇论文为例,Ideker 等人整合酵母的基因组分析和蛋白质组分析,研究了已被视为经典理论的酵母半乳糖利用途径。

这一系统已经研究了数十年,很多人认为它是一个简单的调控网络。

Ideker等人选择了9种分别敲除了不同半乳糖基因的酵母细胞株和一种野生型酵母,利用DNA芯片技术观察每种基因敲除干扰在有/没有半乳糖存在时酵母细胞内的~6200个基因的变化情况。

结果,997个mRNA在一次或多次的干扰中出现变化。

同时,运用ICAT的方法可以在野生型酵母株中观察到大约300个蛋白质在有/没有半乳糖存在时表达量发生了变化。

最后,他们将997个表达水平有变化的mRNA和全部已知的蛋白-蛋白间相互作用及蛋白质-基因间相互作用整合在一起,所得信息绘成一幅相互作用图,显示了在细胞中具有不同功能的分子之间的相互联系。

这种从整体水平观察生物体动态变化的方法为我们了解生命活动提供了新的视角[4,8,9]。

5 复杂性状疾病的系统生物学研究现阶段,由于技术等多方面的发展还相当不成熟,系统生物学在复杂性状疾病研究中的应用并不多见。

但也有人提出了用系统生物学研究复杂性状疾病的大体思路。

例如NM Morel等人提出系统生物学可以应用于#型糖尿病的研究中。

#型糖尿病是一种由多种代谢异常导致的代谢综合征,同时它的发生发展还受到环境因素的影响,例如饮食习惯、超重和运动过少等。

显然,遗传蛋白生化以及各亚类的代谢产物如脂类在#型糖尿病的发病、调节、进展过程中相互联系,共同发挥作用。

若收集该病在基因、蛋白和代谢水平上的资料,加以概括分析,就可能得到所有成分相应变化的关系图,从而为我们进一步探讨该病的发病机制提供帮助[10]。

以下几个例子则是目前系统生物学在复杂性状疾病中的应用情况。

为了更好地阐述高血压的发病机制,Monika Stoll等人分析了取自经F2杂交得到的113只雄性大鼠的239例心血管及肾脏表型,建立了一个大鼠的系统生物学模型用以描述其肾脏,血管及神经介质在高血压发病过程中的功能,同时建立各表型间相关性的生理学模型,最后利用生物信息学工具将这两个模型的数据整合在一起,得到连锁图及生理表达谱图(physiological profiling)。

该研究描绘出在基因组上的特征性位点,发现在染色体1,2,7和18中出现了特征性位点的聚集。

生理表达谱揭示了特征性位点和基因组之间的功能性相互作用,而这种相互作用在用传统方法,即对特征性位点进行数位性状遗传位点连锁分析(QTL linkage analysis)时并不明显[11]。

最近,对动脉粥样硬化的载脂蛋白E*3转基因小鼠模型的研究是对哺乳动物疾病模型进行系统生物学分析的首次报道。

Leiden转基因小鼠被外源引入人类突变的载脂蛋白E基因,这种基因同家族性低 -脂蛋白血症相关。

由于不能识别肝源性低密度脂蛋白受体,这种转基因鼠对饮食诱导的高脂蛋白血症和动脉硬化具有高度的易感性。

但若给予正常饮食,则在生长到9个月大小时只表现为中度的#型(巨噬泡沫细胞)或#型(细胞内脂肪堆积)损伤。

在自出生起给予正常饮食9周后,分别取出具有等位基因的野生型小鼠和Leiden 载脂蛋白E*3转基因小鼠的肝脏组织,进行mRNA表达水平、可溶性脂蛋白丰度及脂质分化谱的分析。

通过对二者的比较可发现,转基因小鼠的载脂蛋白A-1基因表达下降25%,肝脂肪酸结合蛋白(L FABP)基因的表达增加43%,而过氧化物酶体增殖子激活受体 (PPAR alpha)的表达则未发生改变。

随后通过高效液相色谱-质谱联用技术(LC MS)进行定量蛋白质组学及代谢组学分析,发现L FABP在转基因小鼠中较对照组中的量增加了44%,同时甘油三酯和具有选择活性的溶血磷脂胆碱也有增长,为寻找该疾病发生早期的蛋白和代谢物标记分子提供了帮助。

为了进行系统生物学分析,他们将所有小鼠肝脏的转录组学、蛋白质组学及代谢组学的数据整合成为一个数据文件。

然后对该文件进行校对和标准化,使其能够进行单变量和多变量的统计分析。

最后,还进行了相关网络分析,以期待能发现新的相互作用。

从以上研究中可看出,系统生物学方法是发现生物学(disc overy biology)的新工具,可能会为寻找疾病相关的生物标记分子和相关成分提供新线索[12]。

相关主题