蛋白质组学第一课概论一、蛋白质组学(Proteomics)90年代初期开始实施的人类基因组计划,在经过各国科学家近10年的努力下,已经取得了巨大的成就。
不仅完成了十余种模式生物(从大肠杆菌、酿酒酵母到线虫)基因组全序列的测定工作,还有望在2003年提前完成人类所有基因的全序列测定。
那么,知道了人类的全部遗传密码即基因组序列,就可以任意控制人的生老病死吗?其实并不是这么简单。
基因组学(genomics)虽然在基因活性和疾病的相关性方面为人类提供了有力根据,但实际上大部分疾病并不是因为基因改变所造成。
并且,基因的表达方式错综复杂,同样的一个基因在不同条件、不同时期可能会起到完全不同的作用。
关于这些方面的问题,基因组学是无法回答的。
所以,随着人类基因组计划的逐步完成,科学家们又进一步提出了后基因组计划,蛋白质组(proteome)研究是其中一个很重要的内容。
那么,基因组和蛋白质组到底有什么联系?我们可以这样理解生命,遗传信息从DNA(基因)转变为一种被称作mRNA的中间转载体,然后再合成各式各样的结构蛋白质和功能蛋白质,构成一种有机体,完成生命的功能。
基因→ mRNA→蛋白质,三位一体,构成了遗传信息的流程图,这即是传统的中心法则。
现在已经证明,一个基因并不只存在一个相应的蛋白质,可能会有几个,甚至几十个。
什么情况下会有什么样的蛋白,这不仅决定于基因,还与机体所处的周围环境以及机体本身的生理状态有关。
并且,基因也不能直接决定一个功能蛋白。
实际上,往往是通过基因的转录、表达产生一个蛋白质前体,在此基础上再进行加工、修饰,才成为一个具生物活性的蛋白质。
这样的蛋白质还通过一系列的运输过程,到组织细胞内适当的位置才能发挥正常的生理作用。
基因不能完全决定这样的蛋白质后期加工、修饰以及转运定位的全过程。
而且,这些过程中的任何一个步骤发生微细的差错即可导致机体的疾病。
纽约Rockefeller大学的细胞和分子生物学家Günter Blobel博士就是因其“蛋白质内在的信号分子活性,调节自身的细胞内转运和定位”研究上的卓越成就,获得了1999年诺贝尔医学奖和生理学奖。
近些年来人们又发现蛋白质间亦存在类似于mRNA分子内的剪切、拼接,具有自身特有的活动规律。
这种自主性不能从其基因编码序列中预测,而只能通过对其最终的功能蛋白进行分析。
因此说,基因虽是遗传信息的源头,而功能性蛋白是基因功能的执行体。
基因组计划的实现固然为生物有机体全体基因序列的确定、为未来生命科学研究奠定了坚实的基础,但是它并不能提供认识各种生命活动直接的分子基础,其间必须研究生命活动的执行体-蛋白质这一重要环节。
蛋白质组学(proteomics)研究即旨在解决这一问题。
蛋白质组(proteome)一词,源于蛋白质(protein)与基因组(genome)两个词的杂合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。
蛋白质组的研究不仅能为生命活动规律提供物质基础,也能为众多种疾病机理的阐明及攻克提供理论根据和解决途径。
通过对正常个体及病理个体间的蛋白质组比较分析,我们可以找到某些“疾病特异性的蛋白质分子”,它们可成为新药物设计的分子靶点,或者也会为疾病的早期诊断提供分子标志。
确实,那些世界范围内销路最好的药物本身是蛋白质或其作用靶点为某种蛋白质分子。
因此,蛋白质组学研究不仅是探索生命奥秘的必须工作,也能为人类健康事业带来巨大的利益。
与基因重组、表达、序列分析的快速、自动化程度相比,到最近为止,机体组织细胞内蛋白质的序列分析只是实验室小规模研究项目。
随着对生物学、物理、化学及信息学的各种尖端技术的综合应用,蛋白质组研究也正逐步变成高产量、高精确度的分析过程。
现今,蛋白质组研究中主要应用的技术包括:双相电泳(2-DE)、新型质谱(MS)技术、数据库设置与检索系统等。
为了保证分析过程的精确性和重复性,大规模样品处理机器人也被应用。
整个研究过程包括:样品处理、蛋白质的分离、蛋白质丰度分析、蛋白质鉴定等步骤。
当前,蛋白质组分析虽然以双相电泳和质谱分析为其技术基础,但离不开各种先进的数据分析和图象分析软件及网络技术的支持。
自1995年蛋白质组(proteome)一词问世到现在,虽然只有短短的五年多时间,蛋白质组学研究却得到了突飞猛进的发展。
1995年,悉尼大学Humphery Smith I实验室与Williams等4家实验室合作,对至今已知最小的自我复制生物(一种支原体)进行了蛋白质成分的大规模分离与鉴定后,到1996年,蛋白质组研究对象已迅速扩展到单细胞真核生物-酵母以及人体正常组织、病理标本等。
参与国家在1995年只有澳大利亚,而到1997年时已有美国、丹麦、瑞士、英、法、日、瑞典、意、德等10个国家加入。
国际著名学府哈佛、斯坦福、耶鲁、密执安、华盛顿大学、欧洲分子生物学实验室、巴士德研究所、瑞士联邦工业学院等均挤身此类研究。
如今澳大利亚悉尼大学与Macquarie大学仍处领先水平,但美欧多家实验室已奋起直追。
不过,蛋白质组学为一种新生领域,目前还处于初期发展阶段,仍有许多困难有待克服。
如双相电泳和质谱分析的灵敏度还很难将体内微量的调节蛋白质精确分析。
而这种微量调控蛋白的精确表达在生命过程中起到关键性作用。
另外,当前质谱分析仪的价格十分昂贵,约为DNA序列分析仪的十倍之多,严重影响了它的普及和被广泛应用。
再者,成千上万种蛋白质间及蛋白质与其它生物大分子间的相互作用和作用方式的复杂性同样也是蛋白质组研究所面临的问题。
近年来,我国的人类基因组研究正在迅速开展,并取得了许多有意义的成果。
我国曾有很好基础的蛋白质领域方面的研究,如人工合成胰岛素等。
然而,蛋白质组研究在国际上正如火如荼、轰轰烈烈,我国则刚启动。
如何抓住国际上蛋白质组学研究刚刚启动的时机,迅速地进入到蛋白质组学的国际前沿,是摆在我国生命科学研究发展方向决策中的一个重要问题。
网上蛋白质组学资源由于蛋白质组学研究依赖生物信息学和网络技术,internet 上有关蛋白质组研究的技术支持以及蛋白质数据分析的专家系统、数据库等专门网站很多。
蛋白质组研究技术、信息等。
从新药开发角度,发现新蛋白及新作用。
可以找到蛋白质组研究相关企业、各种仪器来源、新闻等。
各种蛋白质组研究相关信息介绍蛋白质鉴定的先进仪器蛋白质鉴定专家系统,Swiss Institute of Bioinformatics蛋白质鉴定专家系统,Australian Proteome Analysis Facility蛋白质鉴定专家系统,Canadian Bioinformatics Resours第二课蛋白质组学研究一、酵母双杂交技术及其在蛋白质组研究中的应用杨齐衡李林*(中国科学院上海生物化学研究所, 上海 200031)作为后基因组时代出现的新兴研究领域之一, 蛋白质组学(proteomics)正受到越来越多的关注。
蛋白质组学的研究目标是对机体或细胞的所有蛋白质进行鉴定和结构功能分析。
蛋白质组学的研究不局限任何特定的方法。
高分辨率的蛋白质分离技术如二维凝胶电泳和高效液相层析, 经典的蛋白质鉴定方法如氨基酸序列分析等, 现代质谱技术, 基因组学研究的各种手段, 现代计算机信息学和计算机网络通讯技术等等, 任何可用于蛋白质研究的技术手段, 蛋白质组学都可能会采用。
它体现的是一个开放的思维和研究方式。
蛋白质-蛋白质的相互作用是细胞生命活动的基础和特征。
这种千变万化的相互作用以及由此形成的纷繁复杂的蛋白质联系网络同样也是蛋白质组学的研究内容, 相应的工作也已经开展。
酵母双杂交系统(yeast two-hybrid system)自建立以来已经成为分析蛋白质相互作用的强有力的方法之一。
该方法在不断完善, 如今它不但可用来在体内检验蛋白质间的相互作用, 而且还能用来发现新的作用蛋白质, 在对蛋白质组中特定的代谢途径中蛋白质相互作用关系网络的认识上发挥了重要的作用。
实验表明双杂交技术在蛋白质组学上的应用是成功的。
本文将就双杂交技术的产生、发展及其在蛋白质组研究方面的初步应用作一介绍。
1 蛋白质组学的产生背景基因组研究自从开展以来已经取得了举世瞩目的成就。
在过去几年中, 已经陆续完成了包括大肠杆菌、酿酒酵母等十多种结构比较简单的生物的基因组DNA的全序列分析[1]。
线虫(C.elegans)的基因组DNA测序工作已基本完成[2]。
规模更为庞大的人类基因组计划预期在下一世纪的前几年(2003~2005年)也将完成全部基因组DNA的序列分析。
这些进展是非常令人振奋的。
但是也随之产生了新问题。
大量涌出的新基因数据迫使我们不得不考虑这些基因编码的蛋白质有什么功能这个问题。
不仅如此, 在细胞合成蛋白质之后, 这些蛋白质往往还要经历翻译后的加工修饰。
也就是说, 一个基因对应的不是一种蛋白质而可能是几种甚至是数十种。
包容了数千甚至数万种蛋白质的细胞是如何运转的?或者说这些蛋白质在细胞内是怎样工作、如何相互作用、相互协调的?这些问题远不是基因组研究所能回答得了的。
正是在此背景下, 蛋白质组学(proteomics)应运而生。
蛋白质组(proteome)一词是马克.威尔金斯(Marc Wilkins)最先提出来的[3], 最早见诸于1995年7月的“Electrophoresis”杂志上[4], 它是指一个有机体的全部蛋白质组成及其活动方式。
蛋白质组研究虽然尚处于初始阶段, 但已经取得了一些重要进展。
当前蛋白质组学的主要内容是, 在建立和发展蛋白质组研究的技术方法的同时, 进行蛋白质组分析。
对蛋白质组的分析工作大致有两个方面。
一方面, 通过二维凝胶电泳得到正常生理条件下的机体、组织或细胞的全部蛋白质的图谱, 相关数据将作为待检测机体、组织或细胞的二维参考图谱和数据库。
一系列这样的二维参考图谱和数据库已经建立并且可通过联网检索。
二维参考图谱建立的意义在于为进一步的分析工作提供基础。
蛋白质组分析的另一方面, 是比较分析在变化了的生理条件下蛋白质组所发生的变化。
如蛋白质表达量的变化, 翻译后修饰的变化, 或者可能的条件下分析蛋白质在亚细胞水平上的定位的改变等。
关于蛋白质组学的介绍可参阅文献[5,6]。
细胞或组织的蛋白质不是杂乱无章的混合物, 蛋白质间的相互作用、相互协调是细胞进行一切代谢活动的基础。
蛋白质间的相互作用及作用方式同样也是蛋白质组研究所面临的问题。
研究蛋白质间的相互作用有多种方法, 常用的如酵母双杂交系统、亲和层析、免疫沉淀、蛋白质交联等。
其中, 酵母双杂交系统是当前发展迅速、应用广泛的主要方法。
2 酵母双杂交系统的建立与发展双杂交系统的建立得力于对真核生物调控转录起始过程的认识。