基因组学课程论文题目:植物基因组学的的研究进展姓名:秦*学号:********植物基因组学的的研究进展摘要:随着模式植物——拟南芥和水稻基因组测序的完成,近年来关于植物基因组学的研究越来越多。
本文主要对拟南芥、水稻2种重要的模式植物在结构基因组学、比较基因组学、功能基因组学等领域的研究进展以及研究所使用的技术方法进行简单介绍。
关键词:植物;基因组学;研究进展The recent progress in plant genomics researchAbstract: With the completion of genome sequencing ofthe model plant-- Arabid opsis and rice,more and more researches on plant genomics emerge in recent yea rs. The research progress of the 2 important model plant--Arabidopsis and rice in structural genomics,comparative genomics,functional genomics and technology methods used in this research are introduced briefly in this paper. Keywords:plant; genomics; research advances前言基因组是1924年提出用于描述生物的全部基因和染色体组成的概念。
1986年由美国科学家Thomas Roderick提出的基因组学是指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录本图谱)、核苷酸序列分析、基因定位和基因功能分析的一门科学。
自从1990年人类基因组计划实施以来,基因组学发生了翻天覆地的变化,已发展成了一门生命科学的前沿和热点领域。
而植物基因组研究与其他真核生物和人类基因组研究有很大的不同。
首先,不同植物的基因组大小即使在亲缘关系非常近的种类之间差别也很大; 其次,很多植物是异源多倍体,即便是二倍体植物中有些种类也存在较为广泛的体细胞内多倍化( endopolyp loidy)现象[1]。
基因组研究主要包括三个层次:①结构基因组学,以全序列测序为目标,构建高分辨率的以染色体重组交换为基础的遗传图谱和以DNA 的核苷酸序列为基础的物理图谱。
②功能基因组学,即“后基因组计划”,是结构基因组研究的延伸,利用结构基因组提供的遗传信息,利用表达序列标签,建立以转录图谱为基础的功能图谱( 基因组表达图谱),系统研究基因的功能,植物功能基因组学是当前植物学最前沿的领域之一。
③蛋白质组学,是功能基因组学的深入,因为基因的功能最终将以蛋白质的形式体现。
近来,以水稻( Oryza sativa)和拟南芥(Arabadopsis thaliana)为代表的植物基因组研究取得了很大进展,如植物分子连锁遗传图谱的构建,在此基础上,已经在植物基因组的组织结构和基因组进化等方面得到了有重要价值的结论; 植物基因组物理作图和序列测定的研究集中于拟南芥和水稻上; 植物比较基因组作图证实在许多近缘植物甚至整个植物界的部分染色体区段或整个基因组中都存在着广泛的基因共线性,使得我们可以利用同源性对各种植物的基因组结构进行研究、分析和利用。
本文主要对拟南芥、水稻2种重要的模式植物在结构基因组学、功能基因组学、比较基因组学等研究领域的研究进展进行归纳总结。
1 拟南芥基因组学的研究1.1 拟南芥结构基因组学研究美国自1990 年启动“植物基因组学”计划,2000 年底公布了模式植物拟南芥的全部序列。
通过分析基因组序列能够获得基因结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。
Bevan[2]对拟南芥第四染色体上1. 9 Mb 的片段进行了全序列测定. 结果发现:平均每4. 8 Kb 就有一个基因存在;54%的基因与GenBank 中的基因具有同源性;约20%的基因在该染色体片段上以基因家族的形式存在; 该染色体片段上共发现五种重复序列成分,约占所测序列的19% 左右:分别为:非编码区中的重复序列、逆转座子成分、叶绿体DNA片段、散布重复的基因家族成员和串联重复的基因家族成员。
高等植物中,拟南芥的基因组最小且具有很少的重复DNA 序列,快速复性序列仅占整个基因组的10% 左右. 两种相关的串联重复序列(180 bp 和500 bp)都定位于拟南芥染色体的中心粒异染区. 另一类串联重复序列( 160 bp)定位于染色体的中部. 第四种高度重复序列是端粒序列. 在拟南芥的1号染色体中心粒区的一个串联重复中发现了一个退化的端粒序列,紧接该序列是一个在遗传作图时有五个位点的重复单元,rDNA 的重复单位大小约为10 Kb,约占整个核基因组的8% 左右。
5SrRNA 的编码基因是以497 bp 为重复单位的串联重复序列,约占基因组的0. 7%[3]。
在拟南芥中还鉴定出了类似逆转座子的成分)Ta1和其相关家族以及转座因子Tat1 和Tag 1,它们都相对具有较低的拷贝数。
在拟南芥的突变体中已经鉴定出了多个遗传标记位点,包括RFLP、PAPD、SSR 等标记。
已经发展了两套重组近交系作图群体,利用这些作图群体,已经构建了高密度的拟南芥分子标记遗传连锁图谱。
拟南芥物理作图利用粘粒载体,YAC( YeastArtif icial Chromosome)载体进行,已经完成了拟南芥高密度物理图谱的构建。
在拟南芥中已利用图位克隆的方法克隆了许多基因[4-5]。
1.2 拟南芥功能基因组学研究2001 年开始,美国全面启动2010 年计划,目标是到2010 年确定拟南芥中所有基因的功能。
中国国家自然科学基金委员会已于2001 年快速启动“拟南芥全部转录调控因子蛋白组学研究”重大国际合作研究项目,2004 年3月,研究取得了重要进展: 共克隆了44 个拟南芥转录调控因子家族中的1 282 个基因,获得了拟南芥所有已知和预测的1 864 个转录因子的序列,利用cDNA ( 互补DNA )微阵列芯片,检测了拟南芥幼苗的转录因子在光调控下的表达,所有表达的基因占整个转录因子的84% ,并通过蛋白质表达实验验证已克隆的拟南芥转录调控因子融合基因中85%以上有一定量的蛋白质表达。
与基因组的全序列测定同时进行的拟南芥表达序列标签( expressedsequence tags)计划也已取得巨大进展。
据网站w ww.Arabido psis.or g 发布的信息表明,至2002 年中期拟南芥的ESTs 标记数已达174 625个。
EST 计划的不足在于随机测序难以得到那些低丰度表达的基因和在特殊环境条件下( 如生物胁迫或非生物胁迫)诱导表达的基因。
为了弥补不足,进行基因组全序列测定。
通过分析基因组序列能够获得基因结构的完整信息,如基因在染色体上的排列顺序,基因间的间隔区结构,启动子的结构以及内含子的分布等。
拟南芥基因组全序列测定的完成对整个植物科学具有重要的意义,例如: 可以用于比较分析真核生物中的转录调节因子。
拟南芥中约有超过5%的序列编码1500 多种转录调节因子,其中45% 是植物特有的。
拟南芥中属于所有真核生物共有的转录调节因子,在其保守的DNA 结合结构域上并不完全与其它真核生物相同,大多数以其特异的线型组合排列。
2水稻基因组学的研究2.1 遗传图谱水稻是已知的单子叶植物中基因组最小的植物之一,基因组大小为450 Mb,共有12 条染色体。
自1988年MeCoueh等[6]利用IR34583(籼)×Bulu Dalam(爪哇)的F2群体构建了第一张水稻分子连锁图谱(含135 RFLP标记)以来,高密度的图谱相继产生。
近年来,随着分子遗传学的迅速发展,国际水稻基因组测序计划(International Rice GenomeSequenci ng Project,IRGSP)成员国以Nipponbare、Kasalath、IR64和Azucena等水稻品种为材料,构建了10个饱和的遗传图谱并与表型的标记进行了整合,以创造新的遗传资源。
1998年,Harushima等[7]构建了一张高密度水稻遗传连锁图,包含2275个遗传标记,覆盖水稻基因组1521.6 cM。
2001年Rice Genome Program(RGP)公布了包含3 267个RFLP分子标记的水稻分子连锁图。
还利用次级三体和终级三体(telotrisomics)将经典遗传图和分子遗传图中的着丝粒位置确定,修正了分子图谱的方向,把RFLP标记定位到特定的染色体臂上;Wu 等[8]构建了水稻第11和第12染色体短臂末端重复基因组区域的图谱,重复基因组区域大小是2.5 Mb,表明水稻也存在大染色体片段的重复区域。
上述遗传图谱在基因定位、物理图谱的构建和基因测序中发挥了或即将发挥巨大作用。
2.2 物理图谱由于遗传图的精确性较低、分辨率有限,而物理图是对遗传图的进一步深化,并能直接应用于图位克隆技术分离目的基因[9-10]。
1998年,Umehara等[11]构建了水稻第一张物理图谱,共筛选到5701个YAC,其中2117个单一YAC分配到12条染色体上,跨度216 Mb,覆盖水稻基因组的50%。
接着日本水稻基因组计划(RGP)开始将YAC重叠群(contig)分解成粘粒(cosmid)DNA克隆,构建更精细的物理图谱。
2001年,RGP还构建了一个覆盖270 Mb(全基因组的63%的YAC文库的物理图,由6934个YAC组成,插入片段平均长度为3 50 kb。
由于YAC克隆不太稳定、插入DNA难以分离、转化效率低等原因,美国Clemson大学基因组研究(Clemson University Genomics Institute,CUGI)又建成了两个BAC库,一个是由37000个Hindm酶切的BAC文库,插入片段平均长度为128.5 kb;另一个是有56 000个克隆的Eco R工BAC库,插入片段平均大小为120 kb,两者覆盖水稻基因组的26倍。
2001年,RGP为了克服YAC克隆的局限性,又以PAC为载体构建了水稻Nipponbare 基因组文库,此文库由72 000个Sau3A I酶切克隆组成,平均插入片段长120 kb,覆盖水稻基因组的16倍。
,国际水稻基因组测序计划(IRGSP)已于2002年12月宣布,利用克隆连克隆(逐步克隆)测定法(clone by clone sequencing),提前3年完成了水稻12条染色体的碱基测序工作。