【摘要】基因组相对较稳定,而且各种细胞或生物体的基因组结构有许多基本相似的特征;蛋白质组是动态的,随内外界刺激而变化。
对蛋白质组的研究可以使我们更容易接近对生命过程的认识。
蛋白质组学是在细胞的整体蛋白质水平上进行研究、从蛋白质整体活动的角度来认识生命活动规律的一门新学科,简要介绍功能基因组学和蛋白质组学的科学背景、概念及其应用。
【关键词】基因组;功能基因组学;蛋白质组学;一、基因组及基因组学的概念基因组(genome)一词系由德国汉堡大学H.威克勒教授于1920年首创,用以表示真核生物从其亲代所继承的单套染色体,或称染色体组。
更准确地说,基因组是指生物的整套染色体所含有的全部DNA序列。
由于在真核细胞的线粒体和植物的叶绿体中也发现存在遗传物质,因此又将线粒体或叶绿体所携带的遗传物质称为线粒体基因组或叶绿体基因组。
原核生物基因组则包括细胞内的染色体和质粒DNA。
此外非独立生命形态的病毒颗粒也携带遗传物质,称为病毒基因组。
所有生命都具有指令其生长与发育,维持其结构与功能所必需的遗传信息,本书中将生物所具有的携带遗传信息的遗传物质总和称为基因组。
[1]基因组学(genomic)一词系由T.罗德里克(T.Roderick)于1986年首创,用于概括涉及基因组作图、测序和整个基因组功能分析的遗传学学科分支,并已用来命名一个学术刊物Genomics。
基因组学是伴随人类基因组计划的实施而形成的一个全新的生命科学领域。
[1]基因组学与传统遗传学其他学科的差别在于,基因组学是在全基因组范围研究基因的结构、组成、功能及其进化,因而涉及大范围高通量收集和分析有关基因组DNA的序列组成,染色体分子水平的结构特征,全基因组的基因数目、功能和分类,基因组水平的基因表达与调控以及不同物种之间基因组的进化关系。
基因组学的研究方法、技术和路线有许多不同于传统遗传学的特点,各相关领域的研究仍处于迅速发展和不断完善的过程中。
基因组学的主要工具和方法包括:生物信息学,遗传分析,基因表达测量和基因功能鉴定。
二、功能基因组学的概念及应用2001年,人类基因组计划公布了人类基因组草图,为基因组学研究揭开新的一页。
基因组学是研究生物基因组的组成,组内各基因的精确结构、相互关系及表达调控的科学。
基因组学、转录组学、蛋白质组学与代谢组学等一同构成系统生物学的组学(omics)生物技术基础。
基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics),又被称为后基因组(postg enome)研究,成为系统生物学的重要方法。
(一)功能基因组学的概念功能基因组学是指在全基因组序列测定的基础上,从整体水平研究基因及其产物在不同时间、空间、条件的结构与功能关系及活动规律。
新药开发的关键是药物发现。
目前多数以药物作用靶点为基础的药物发现流程是:基因组-作用新靶点-筛选-先导物-药物。
[2]结构基因组学是继人类基因组之后又一个国际性大科学热点,主要目的是试图在生物体的整体水平上(如全基因组、全细胞或完整的生物体)测定出(以实验为主、包括理论预测)全部蛋白质分子、蛋白质-蛋白质、蛋白质-核酸、蛋白质-多糖、蛋白质-蛋白质-核酸-多糖、蛋白质与其他生物分子复合体的精细三维结构,以获得一幅完整的、能够在细胞中定位以及在各种生物学代谢途径、生理途径、信号传导途径中全部蛋白质在原子水平的三维结构全息图。
在此基础上,使人们有可能在基因组学、蛋白质组学、分子细胞生物学以致生物体整体水平上理解生命的原理。
对疾病机理的阐明、对疾病的防治有重要应用意义。
(二)功能基因组学的应用基因组DNA测序是人类对自身基因组认识的第一步。
随着测序的完成,功能基因组学研究成为研究的主流,它从基因组信息与外界环境相互作用的高度,阐明基因组的功能。
功能基因组学的研究内容:人类基因组 DNA 序列变异性研究、基因组表达调控的研究、模式生物体的研究和生物信息学的研究等。
(1)基因组表达及调控的研究。
在全细胞的水平,识别所有基因组表达产物mRNA和蛋白质,以及两者的相互作用,阐明基因组表达在发育过程和不同环境压力下的时、空的整体调控网络。
(2)人类基因信息的识别和鉴定。
要提取基因组功能信息,识别和鉴定基因序列是必不可少的基础工作。
基因识别需采用生物信息学、计算生物学技术和生物学实验手段,并将理论方法和实验结合起来。
基于理论的方法主要从已经掌握的大量核酸序列数据入手,发展序列比较、基因组比较及基因预测理论方法。
识别基因的生物学手段主要基于以下的原理和思路:根据可表达序列标签(STS);对染色体特异性Cosmid进行直接的cDNA选择;根据CpG岛;差异显示及相关原理;外显子捕获及相关原理;基因芯片技术;基因组扫描;突变检测体系等。
(3)基因功能信息的提取和鉴定。
包括:人类基因突变体的系统鉴定;基因表达谱的绘制;“基因改变-功能改变”的鉴定;蛋白质水平、修饰状态和相互作用的检测。
(4)在测序和基因多样性分析。
人类基因组计划得到的基因组序列虽然具有代表性,但是每个人的基因组并非完全一样,基因组序列存在着差异。
基因组的差异反映在表型上就形成个体的差异,如黑人与白人的差异,高个与矮个的差异,健康人与遗传病人的差异,等等。
出现最多基因多态性就是单核苷酸多态性(SN Ps)。
(5)比较基因组学。
将人类基因组与模式生物基因组进行比较,这一方面有助于根据同源性方法分析人类基因的功能,另一方面有助于发现人类和其他生物的本质差异,探索遗传语言的奥秘。
三、蛋白质组及蛋白质组学(一)蛋白质组及蛋白质组学的概念蛋白质是生命功能的主要体现者,多数疾病体现在蛋白质水平,基因表达和蛋白表达之间并不总是呈现良好的相关性[3]。
蛋白质组是从整体水平研究胞内蛋白质组成及其活动规律。
蛋白质组学以蛋白质组为研究对象,从蛋白质整体水平上认识生命活动的规律。
同基因组比,蛋白质组在时间、空间上具有多样性,变化性大,研究的切入点多。
蛋白质组学(基于2DE,灵敏、多功能地研究蛋白水平的变化)可以分析非转录水平控制的细胞过程,寻找靶点和优化化合物(抗菌活性、抗菌谱、生物利用度、药代动力学等指标),补充DNA芯片等技术的不足。
蛋白质组(Proteome)这一概念是由澳大利亚学者Wilkins和Williams等人[4]于1994年提出,并首次公开发表在1995年7月的Electrophoresis杂志上,指的是由一个细胞或一个组织的基因组所表达的全部相应的蛋白质。
蛋白质组与基因组相对应,也是一个整体的概念,是基因组表达的全部蛋白。
但两者又有根本的不同之处。
基因组是静态的,一个有机体从它的发生、发展到衰老、死亡,不同细胞、组织和器官的基因组是基本稳定不变的。
但基因组内各个基因表达的条件和表达的程度则随时间、地点和环境条件而不同,因而它们表达的模式,即表达产物的种类和数量随时间、地点和环境条件也是不同的。
所以,蛋白质组是一个动态的概念。
它不仅在同一个有机体的不同组织和不同细胞中不同;在同一机体的不同发育阶段,直至最后消亡的全过程中也在不断变化;机体处于不同生理状态下不同;在不同外界环境下也不同。
实际研究中能够取得的蛋白质组分子实体通常只是总蛋白质组的一部分。
可见既是整体又是动态的蛋白质组的研究任务有多么繁重了。
随着蛋白质组的提出,蛋白质组学(Proteomics)[5]也自然而然地孕育产生。
但目前,蛋白质组学仍无明确的定义。
一般认为它是研究蛋白质组或应用大规模蛋白质分离和识别技术研究蛋白质组的一门学科,是对基因组所表达的整套蛋白质的分析。
现阶段,蛋白质组学研究的内容不仅包括对各种蛋白质的识别和定量化,还包括确定它们的细胞内外的定位、修饰、相互反应、活性,和最终确定它们的功能。
并对由此获取的数据进行数据库构建,以及不可或缺的推动这一学科进步的蛋白质组分析技术研究。
由于对全部蛋白质的研究是非常困难的,所以中国的科学工作者提出了一种全新的研究策略:功能蛋白质组学[6]。
它是位于对个别蛋白质的传统蛋白质研究和以全部蛋白质为研究对象的蛋白质组研究之间的层次,研究特定时间、特定环境和试验条件下基因组所表达的蛋白质。
蛋白质组信息可以从生物信息学途径获得。
一半是基因重复或功能结构域混合,尤其是参与脂肪酸代谢、基因表达调控、特殊富甘氨酸的PPE、PE。
1/6与发表的其他生物蛋白无相似性。
MTB基因组中有4个大的MCE操纵子mce,编码巨噬细胞集落因子有4个拷贝,均位于同一个operon(编码8个组织方式完全一致的基因,mce之前的两个编码膜整合蛋白,之后的5个编码带疏水信号肽的蛋白,说明该蛋白可能是分泌或者是定位在细胞的表面),其蛋白可能介导宿主与致病菌的初始相互作用;有一簇基因可能编码与ESAT-6样蛋白分泌有关的结构成分;与脂肪酸代谢所需基因紧密连锁的MMPL编码大的膜蛋白,可能参与脂类运输;与游离生存的细菌比,MTB的运输蛋白库明显较少,与其胞内生活方式一致。
[7] (二)蛋白质组学在其他研究方面的应用1、蛋白质组学在细菌研究中的应用蛋白质组学方法已广泛用于研究细菌在外界环境变化时其表达蛋白的变化情况。
如对霍乱弧菌以及大肠杆菌在不同酸碱条件下蛋白表达的变化的研究,表明这些病原菌会随环境的改变而调节蛋白表达以使其达到最大的致病能力。
蛋白质组学可以与基因组学互补,它能识别某些基因的预测产物,尤其是膜蛋白,这些膜蛋白往往是疫苗的有效成分,如Deb N.Chakravarti 等研究了Hp疫苗的相关组分,加速了疫苗的开发。
蛋白组学研究也应用在细胞周期研究中,细菌在繁殖周期的每个阶段合成大量蛋白,表明周期性的蛋白表达有助于细菌充分利用能源,保持合适的细菌数量,对机体产生一定的作用。
这种对细菌细胞周期调控蛋白表达和降解的研究有助于抗感染措施的制定。
对细菌某些特异抗原的识别可以为一些疾病提供诊断标记。
2、蛋白质组学在真核生物研究中的应用蛋白质组学研究已广泛应用于真核生物的研究中。
Michel Perrot等用2DE 及质谱、免疫杂交、微量测序等方法分离和鉴定了酿酒酵母的401种蛋白,309种以前曾报道过,剩余的92种是新发现的,从而拓展了酵母参考图谱,为研究细胞功能、酵母翻译因子靶点提供了条件[8]。
3、蛋白质组学在植物研究中的应用植物蛋白质组学虽然刚刚起步,但它的发展将对植物界有很大的冲击。
H型硫氧还蛋白能减少靶蛋白的二硫键,促使种子发芽。
为了更好地了解硫氧还蛋白在种子中的作用,应先了解其作用的靶蛋白。
Hiroyuki Yano等运用蛋白组学方法分离了20多种靶蛋白,并鉴定了其中的5种,其中3种是变态反应原,2种与落叶及种子成熟有关4、蛋白质组学与肿瘤研究肿瘤涉及到控制正常细胞增殖机制的破坏。