第9卷 第1期2007年3月 衡水学院学报J o u r n a l o f H e n g s h u i U n i v e r s i t yV o l.9,N o.1Ma r.2007植物功能基因组学及其研究技术崔兴国(衡水学院 生命科学系,河北 衡水053000)摘 要:植物基因组的研究已经由以全基因组测序为目标的结构基因组学转向以基因功能鉴定为目标的功能基因组学研究.植物功能基因组学研究是利用结构基因组学积累的数据,从中得到有价值的信息,阐述D N A序列的功能,从而对所有基因如何行使其职能并控制各种生命现象的问题作出回答.近年来植物功能基因组学的研究技术主要包括表达序列标签、基因表达的系列分析、D N A微阵列和反向遗传学等.对植物功能基因组学的研究将有利于我们对基因功能的理解和对植物形状的定性改造和利用.关键词:植物;功能基因组学;研究技术中图分类号:Q3-3 文献标识码:A 文章编号:1673-2065(2007)01-0023-04 基因是细胞的遗传物质,决定细胞的生物学形状,细胞的生物学功能最终是由大量的基因表达完成的.随着人类基因组“工作框架图”的完成,生命科学研究的重点已经从结构基因组学转移到了功能基因组学的研究,特别是模式植物拟南芥(A r a b i d o p-s i s t h a l i a n a)和水稻(O r y z a s a t i v a)基因组测序的完成,公共数据库中已经积累了大量基因序列信息,获得了许多与植物发育相关的功能基因,在此基础上应用实验分析方法并结合统计和计算机分析来研究基因的表达、调控与功能,并相应诞生和发展了一批新的研究技术,为功能基因组学的研究提供了必要而有效的技术支撑.功能基因组学研究的最终目标是解析所有基因的功能,即从基因水平上大规模批量鉴定基因的功能,进而全面研究控制植物生长发育及响应环境变化的遗传机制,在基因组序列与细胞学行为之间起到桥梁作用,共同承担起从整体水平上解析生命现象的重任.1 植物功能基因组学研究植物的生长和发育是一个有机体或有机体的一部分形态建成和功能按一定次序而进行的一系列生化代谢反应的总合,反应在分子水平上,它要求相应的遗传代谢途径必须按照特定的时空次序严格进行以保证正常发育.植物功能基因组研究就是要利用植物全基因组序列的信息,通过发展和应用系统基因组水平的实验方法来研究和鉴别基因组序列的作用;研究基因组的结构、组织与植物功能在细胞、有机体和进化上的关系以及基因与基因间的调控关系;从表达时间、表达部位和表达水平3个方面对目的基因在植物中的精细调控进行系统研究.当前植物功能基因组学研究主要集中于一年生的拟南芥与水稻两个物种上,这主要是由于它们的遗传背景清楚,基因组较小,基因结构简单而且易于进行分子生物学操作.拟南芥研究组“2010计划”的宏伟目标是充分利用拟南芥基因组计划获得的序列信息并结合功能基因组研究技术来获知其25000个基因的全部功能,例如开花的诱导过程是植物生活周期中最奇妙的过程,目前从拟南芥中鉴定了提早开花和延迟开花的多种突变体,显示植物开花受多个遗传基因的控制,如延迟开花的两个突变体是由等位基因C O(C O N S T A N S)和L D(C O LD L U M I N I DE P E N-D E N S)突变引起,这两个基因均已被克隆,并使其在转基因植物的叶片中进行表达,将C O基因转移到拟南芥中,高效表达C O蛋白的转基因植株即使处于短日照条件下也会开花,这说明C O基因具有激活开花基因的作用.对模式植物功能基因组的研究将有助于整个植物基因组学的研究.目前的功能基因组研究主要包括以下几个方面:(1)c D N A全长克隆与测序;(2)获得D N A芯片①收稿日期:2006-10-12作者简介:崔兴国(1963-),女,河北冀州市人,衡水学院生命科学系副教授.等基因转录图谱;(3)突变体库的构建;(4)高通量的遗传转化鉴定系统;(5)生物信息技术平台与相应数据库的构建;(6)研究基因组表达的全部蛋白质及其相互作用[1].目前国内外都注重尽可能获得更多的全长基因的表达序列、饱和突变体库的创建、高通量的转基因遗传分析和比较基因组学研究,以便通过改变基因的表达状况寻找基因与性状的联系,而最终阐明基因的功能.2 应用于植物功能基因组学的研究技术为了功能基因组学的深入研究,人们相继建立了一系列有效的技术和方法,包括基因表达系统分析、表达序列标签、基因微阵列技术、插入突变等等,这些前沿技术为功能基因组学的研究提供了强有力的技术支撑.2.1 基因表达的系列分析(s e r i a l a n a l y s i s o f g e n ee x p r e s s i o n,S A G E)这是一种能快速、详细研究基因表达的新技术,其主要理论依据是采用来自c D N A3'一端特定位置的一段序列所含有的足够信息作为标签来区分和鉴定基因组中95%的基因,这一段基因特异的序列被称为S A G E标签,通常为9~10b p的寡核苷酸序列.通过对c D N A制备S A G E标签并通过连接酶将多个标签(一般20~60个)随机串联起来,形成大量的多联体并克隆到载体中,建立S A G E文库,然后对每个克隆进行测序.不仅可显示各S A G E标签所代表的基因在特定组织或细胞中是否表达,而且还可根据所测序列中各S A G E标签所出现的频率,来确定其所代表的基因的表达量等信息,操作相对简便,高度敏感而且可将基因表达的数据保留下来,作为数据库供当前或未来反复对比结果之用.可用于研究任何一种由细胞转录变化引起的生物现象,而无须对基因性质和生物系统预先有所了解.首次将S A G E技术应用于高等植物中进行全基因表达定量研究的是日本科学家M a t s u m u r a等人构建了水稻幼苗的转录图谱,并获得了水稻实生苗10122个S A G E标签,代表了5921个表达的基因.F i z a m e s等用S A G E技术分析了拟南芥根、叶片及花粉的基因表达概况,并根据拟南芥基因组的26620个注释基因,建立和提供了一种新的计算机处理方法及一个可进行拟南芥转录谱研究的S A G E参考数据库. S A G E最重要的用途是确定、分离那些在特定组织中或对外界胁迫做出不同反应时表达的基因.一方面通过所获得的S A G E标签与已知基因进行对比分析,若发现标签没有同源序列,则这个标签就有可能与新基因对应,此时用S A G E标签作探针筛选c D N A 文库,就有可能钓出新基因.另一方面,通过对不同状态下表达图谱的比较会发现基因表达上的差异,这些差异往往是由于细胞或组织所处的状态所致,差异基因很可能就是与之相关的新基因[2].2.2 表达序列标签测序技术(e x p r e s s e ds e q u e n c e t a g,E S T)这种方法是发现和鉴定表达基因的最快途径,主要是通过对随机选取的某一组织的m R N A反转录成c D N A并克隆到载体构建成c D N A文库后,大规模随机挑选c D N A克隆,从一端或两端进行测序所获得的基因序列片段称为E S T,每个E S T长度一般300~500b p之间就可以包含已表达的该基因的信息,即每个c D N A克隆不必全部测序,只要从一端进行单轮测序,测序长度在300b p以上就认为已包容了必要的信息.目前已在玉米、小麦、大麦、棉花、大豆、番茄、油菜、杨树、松树等19种植物中进行了E S T研究,得到大约160000条E S T数据,使我们能够在未完成全部基因测序的条件下,在具有较大基因组的物种中发现基因和研究基因功能[3].许多实验表明,E S T还可作为探针有效地筛选酵母人工染色体克隆,构建染色体物理图谱,用于基因的表达和功能研究.人们对水稻的大规模基因组测序研究表明,某些E S T具有明显的文库特异性分布.其组成在某种程度上可以反映出与植物生长、分化相关的特异基因表达调控的情况,可作为发现新基因的有效工具.S t e r k y等对16个不同组织或同一组织不同发育阶段的杨树总共102019条E S T比较分析后共获得4000多个可用于精确注释基因组序列的全克隆序列,并与拟南芥基因组序列比较,看出它们之间有较高的相似性,据此认为,一年生植物与多年生植物的不同可能主要是由于基因表达调控不同.此外, E S T还可用于确定基因转录概况,其基本原理是高效表达的基因产生高水平的m R N A,相应的c D N A 在文库中丰富表达,随机挑取克隆测序后,E S T数量就大体代表了基因在群体中的表达谱.2.3 抑制性差减杂交(s u p p r e s s i o ns u b t r a c t i v eh y-b r i d i z a t i o n,S S H)基因表达是一个复杂而精细的调控过程,高等真核生物约有10万个不同基因,但在生物体的发育24 衡水学院学报 第9卷过程中只有15%的基因得以表达,而这约15000个基因的表达是按时间和空间顺序有序地进行的,这种表达方式即为基因的差异表达.植物在不同生长发育阶段的不同类型细胞,以及不同外界条件下的基因的表达具有一定的差异性,比较各种基因表达上的差异,明确植物不同类型的细胞在特定条件下的基因表达差异及其调控,是研究生命过程分子机制的基础和分离克隆目的基因的前提.基因差异表达分析是建立在具有不同逆境胁迫抗性的材料在受到逆境胁迫后,其抗性基因会转录为不同的m R N A 来启动抗性基因的表达的基础上,通过对这些基因表达产物的差异进行技术分析,可初步获得这些抗性基因的信息,S S H是一种富集差异表达基因的有效而简单的方法.其基本步骤为:提取2种不同细胞的m R N A为驱动组和检测组,反转录成c D N A,分别用同一种识别四碱基序列的限制酶消化,以产生大小适当的末端c D N A片段,将检测组c D N A平分为两等份,各自接上2种接头,与过量的驱动组c D N A 杂交,得到4种产物:单链检测组c D N A、检测组双链c D N A、检测组和驱动组的异源双链c D N A、单链驱动组c D N A,实现了检测组单链c D N A均等化,即单链c D N A的相对含量达到基本一致,由于检测组c D N A中与驱动组c D N A序列相似的片段大都和驱动组形成了异源双链分子,使检测组c D N A中的差异表达基因的目标得到大量富集,再次杂交单链检测组的c D N A和驱动组的c D N A一起形成各种双链分子,可进一步富集差异表达基因的c D N A,经过几轮循环可以将差异表达基因扩增1000倍[4].该技术已广泛应用于分子遗传学和定向克隆的研究中,如鉴别病理变化、不同生物体生长发育和组织分化中的基因表达变化、不同基因型植物的基因表达变化以及外界因素诱导使植物产生差异表达的基因等.例如植物在不良环境条件影响下,基因表达会发生变化,导致植物体内生理生化的反应,以应答逆境的胁迫,在不同逆境因子所导致的不同植物的基因差异表达中,可得到抗逆境胁迫的特异表达基因,采用S S H方法由于速度快、效率高,一次反应可以同时分离几十或成百个差异表达基因,这样就可以在短时间得到多种不同的植物抗逆差异表达基因,为克隆抗逆相关基因库建立了技术基础.2.4 D N A微阵列(D N Am i c r o a r r a y)此技术可将c D N A文库中的序列分离固定于支持物上,同时检测比较样品中众多序列的表达情况和分析基因表达图谱,又称为c D N A芯片技术.基本原理是把预先合成的c D N A、E S T等一系列D N A片段固定在硅片、玻璃或尼龙膜等固相支持物上,与放射性同位素或荧光物标记的来自不同细胞、组织或器官m R N A或其反转录生成的c D N A进行分子杂交,然后用激光共聚焦显微镜对芯片进行扫描,根据探针位置和序列及杂交信号强弱来确定靶D N A的表达情况.由于D N A片段可高密度点到固相支持物上,而且样品可用多种荧光物进行标记,所以这一技术具有微型化、自动化和平行化等特点,可同时快速检测目的材料中上万个甚至整个基因组基因的表达差异[5].目前,D N A微阵列技术已广泛应用于植物防御、果实成熟、种子发育、环境胁迫响应等研究中,当前应用的微阵列系统主要是c D N A微阵列,即c D N A克隆的P C R扩增产物固定到固相支持物上的一种微阵列.2002年S e k i等用约7000个全长c D-N A的微阵列,分析了拟南芥在干旱、低温、高盐3种不同处理的基因表达概况,发现有22个基因对这3种胁迫都能响应.Y a n g等研究刺槐心材化合物形成的分子机制过程中,对刺槐树干的基因表达概况进行分析发现已获得的2915条E S T序列中有55.3%的序列与已知基因序列不匹配,他们用聚类分析所得到的2278个单基因系所构建的c D N A微阵列,对刺槐木材不同区域的基因表达情况进行分析时,发现各个区域基因表达不同,分别代表了各区域不同的生理代谢过程.2.5 反向遗传学技术(r e v e r s e g e n e t i c s)研究基因功能最直接的方法是在获得功能丧失性突变体之后研究该突变体的表型.但是在植物中利用同源重组方法(一种反向遗传学方法)进行定点突变相当困难,例如拟南芥是第一个完成基因组测序的开花植物,但其90%基因的功能仍未鉴定.从理论上我们可以讲通过与已知功能基因的同源性比较来获知新发现的基因序列的功能,但由于许多基因缺乏相应的同源物,使得这些基因的功能无法得到准确鉴定.实验表明,当转座子或根癌农杆菌T -D N A插入到基因组中后即会发生基因突变即人为创造功能基因缺失突变体,在获得插入突变体后结合突变体表型研究的方法,可直接确定基因的功能[6].转座子又称植物转位因子,是存在于染色体D N A上的一段可自我复制和移动的D N A序列,可25第1期 崔兴国 植物功能基因组学及其研究技术 从一个基因座位转移到另一个基因座位.转座子的转位插入作用,使被插入的目的基因发生突变失去活性,而转座子的删除又可使目的基因恢复活性.当转座子插入到某个功能基因内部或邻近位点时,就会诱发目标功能基因发生突变而被标识,并最终导致表型变化,形成突变植株.如果此段转座子D N A 插入序列是已知的,那么它便可用作D N A杂交的分子探针,从突变体植株的基因组D N A文库中筛选到突变的基因,这样插入的转座子D N A序列相当于在植物基因上贴了一张转座子标签,就可以使用T A I L -P C R等方法将该基因序列分离出来.其优点是转座子插入引起的突变会由于转座子的切离而回复,转座子在染色体上定位后很容易确定与其连锁的突变基因的相对位置,而且转座子导入目标植物可通过自交、杂交、回交等方法得到一个大的含不同插入位点的转座子群体,技术快捷准确简单,能够规范地找到与某一表型相关的基因.最近一种全新的反向遗传学研究方法—T I L L I N G技术的问世引起了广泛关注,该技术的技术路线是:植物种子先经化学诱变获得点突变后进行种子培养获得第一代突变个体,经自花授粉获得第二代突变个体,提取D N A进行突变体筛选,测序鉴定.其特点是定向诱导基因组局部突变,可快速有效地从经化学诱变剂诱变过的突变群体中鉴定出点突变,不需要耗时的转基因过程,因而具有成本低、效率高的优势,已用于多种植物中[7].综上所述,E S T、S A G E、S S H、D N A微阵列技术可有效地应用于植物功能基因组学研究,但它们都有各自固有的局限性,如在植物体内有些基因的表达量极少,用E S T、S A G E、D N A微阵列就可能无法检测到这些基因,另外植物的表型与基因不一定是一对一的,许多时候是通过一系列表达调控过程或代谢过程而表现出来的,因此反向遗传学的功能缺失突变体策略有可能无法确定单个基因的功能.这说明植物功能基因组学的研究单独运用某一种技术无法真正获知我们所感兴趣的基因的功能,需要将多种技术有机地结合在一起,取长补短,而且需要发明更精确的基因检测技术和基因功能鉴定技术支撑,并需要开展广泛的国际合作.相信通过世界各个研究室的共同努力,植物功能基因组中基因的功能将会全部得到阐明,到那时,采用生物技术对植物进行高效而安全的遗传改良将成为可能.参考文献:[1] 邢俊杰,梁铃,曹孟良,等.植物功能基因组研究进展[J].生命科学研究,2005,9(2):22-26.[2] 朱莉,常汝镇,邱丽娟,等.基因表达系列分析技术在植物基因表达分析中的应用[J].中国农业科学,2003,36(11):1233-1240.[3] 岳思君,郑蕊,陈宁,等.植物功能基因组学研究进展[J].生物技术通讯,2005,16(2):217-220.[4] 董霞,李文正,刘世贵,等.抑制消减杂交技术及其在植物基因表达研究中的应用[J].植物生理学通讯,2006,42(3):515-522.[5] 石海燕.植物抗病基因的克隆技术[J].生命的化学,2005,25(4):330-333.[6] 王景雪,孙毅,徐培林,等.植物功能基因组学研究进展[J].生物技术通报,2004,(1):18-22.[7] 高泽发,陈绪清,杨凤萍,等.植物功能基因组研究方法及进展[J].生物学杂志,2005,22(6):1-4.P l a n t F u n c t i o n a l G e n o m i c s a n dI t s R e s e a r c hT e c h n o l o g yC U I X i n g-g u o(D e p a r t m e n t o f L i f e S c i e n c e,H e n g s h u i U n i v e r s i t y,H e n g s h u i,H e b e i053000,C h i n a)A b s t r a c t:T h e r e s e a r c h o f p l a n t g e n o m eh a sb e e nt r a n s f e r r e df r o m t h es t r u c t u r a l g e n o m i c s f o c u s i n go nd e t e r m i n i n gt h ec o m p l e t es e-q u e n c e s o f t h e g e n o m e t o t h e f u n c t i o n a l g e n o m i c s f o c u s i n g o n e l u c i d a t i n g t h e b i o l o g i c a l f u n c t i o n o f g e n e s.T h a t p l a n t f u n c t i o n a l g e n o m-i c s s t u d y i s t o g i v ea na n s w e r t o h o wg e n e c o n t r o l s v a r i o u s b i o l o g i c a l p h e n o m e n a,o b t a i n i n g v a l u a b l e i n f o r m a t i o n f r o mt h e d a t a o f s t r u c-t u r e g e n o m i c s a n d e x p o u n d i n g t h e f u n c t i o n o f D N As e q u e n c e.I nr e c e n t y e a r s,m a i n m e t h o d s o f s t u d y i n g t h e p l a n t f u n c t i o n a l g e n o m i c s i n c l u d e e x p r e s s e d s e q u e n c e t a g,s e r i a l a n a l y s i s o f g e n e e x p r e s s i o n,D N Am i c r o a r r a y,r e v e r s e g e n e t i c s a n d s o o n.I t i s c u r r e n t l y b e i n g w i d e l y f o c u s e d o nt h e g e n e e x p r e s s i o nb y t r a n s c r i p t p r o f i l i n g a n dt a k e u s r a p i d l y f o r w a r d i no u r u n d e r s t a n d i n g o f p l a n t b i o l o g i c a l t r a i t s. K e yw o r d s:p l a n t;f u n c t i o n a l g e n o m i c s;r e s e a r c ht e c h n o l o g y〔责任编校:魏彦红 英文校对:安晓红〕26 衡水学院学报 第9卷。