当前位置:文档之家› 作物分子设计育种(精)

作物分子设计育种(精)

目前,对大多数作物的育种来说,育种家可供利用的亲本材料有几百甚至上千份,可供选择的杂交组合有上万甚至更多。

由于试验规模的限制,一个育种项目所能配置的组合一般只有数百或上千,育种家每年花费大量的时间去选择究竟选用哪些亲本材料进行杂交;对配制的杂交组合,一般要产生2000个以上的 F2 分离后代群体,然后从中选择1%~2%的理想基因型,中选的 F2 个体在遗传上是杂合体,需要做进一步的自交和选择,每个中选的 F2 个体一般需产生100个左右的重组近交家系才能从中选择到存在比例低于1%的理想重组基因型。

育种早期选择一般建立在目测基础上,由于环境对性状的影响,选择到优良基因型的可能性极低,统计表明,在配制的杂交组合中,一般只有1%左右的组合有希望选出符合生产需求的品种,考虑到上述分离群体的规模,最终育种效率一般不到百万分之一。

因此常规育种存在很大的盲目性和不可预测性,育种工作很大程度上依赖于经验和机遇。

生物个体的表型是基因型和环境共同作用的结果,植物育种的主要任务是寻找控制目标性状的基因,研究这些基因在不同目标环境群体下的表达形式,聚合存在于不同材料中的有利基因,从而为农业生产提供适宜的品种。

生物数据可以来自生物的不同水平,如群体水平、个体水平、孟德尔基因水平和 DNA 分子水平等,各类生物数据为作物育种提供了大量的信息。

尤其随着分子生物学和基因组学的飞速发展,生物信息数据库积累的数据量极其庞大,但由于缺乏必要的数据整合技术,可资育种工作者利用的信息却非常有限,作物重要农艺性状基因( quantitative trait locus,QTL )的定位结果也难以用于指导作物育种实践。

作物分子设计育种将在庞大的生物信息和育种家的需求之间搭起一座桥梁,在育种家的田间试验之前,对育种程序中的各种因素进行模拟筛选和优化,提出最佳的亲本选配和后代选择策略,从而大幅度提高育种效率。

1 作物分子设计育种相关基础研究现状及发展趋势近年来,主要作物的基因组学研究,特别是拟南芥、玉米、水稻和小麦基因组学研究取得了巨大成就,基因定位和 QTL 作图研究为分子设计育种奠定了良好基础,计算机技术在作物遗传育种领域的广泛应用为分子设计育种提供了有效的手段。

国内外生物领域的高技术飞速发展,主要表现在以下5个方面。

1.1 生物信息学遗传信息数据库中的数据呈“爆炸式”增长在过去的几年里,由于基因组学和蛋白组学的飞速发展,3大核酸序列数据库,即欧洲生物信息研究所( European Bioinf ormatics Institute,EBI )维护的 EMBL 数据库、美国国家生物技术信息中心( National Center for Biotechnology Inform ation,NCBI )的 GenBank 数据库和日本国立遗传学研究所( Japan National Institute of Genetics Center for Informati on Biology )的 DDBJ 数据库,截至1992年1月总计收录核酸序列数据只有59317条,共77805556碱基对;截至2005年3月,3大数据库收录的核酸序列已经达到43118204条,共计47099081750碱基对,年份间呈几何级数增长。

2002年,国际3大机构 PIR ( Protein Information Resources,蛋白质信息资源,美国国家健康研究所)、EBI 和 SIB ( Swiss Institute of Bioi nformatics,瑞士生物信息研究所)将3个蛋白质数据库 PIR、SWISS-PROT 和 TrEMBL 合并组建了单一的权威性蛋白质数据库UniProt,截至2005年5月24日已经收录了1748002条蛋白质序列共计555158414个氨基酸。

在这些数据库中,有关植物 DNA 序列主要来源于拟南芥、玉米、水稻和小麦等。

水稻作为模式植物和世界上最重要的粮食作物之一,其基因组学研究一直走在其他作物的前列,是第一个完成测序的重要农作物。

我国在2002年完成了世界首张籼稻基因组草图,与 Syngenta 公司完成的粳稻基因组草图同时发表在 Science。

随后完成了粳稻(日本晴)4号染色体的精确测序,是世界上首先完成的2条精确测序水稻染色体之一。

同时还完成了籼稻(广陆矮4号)4号染色体80%的精确测序以及水稻4号染色体着丝粒的序列分析。

上述工作的完成使我国水稻基因组测序研究处于世界领先水平。

所有这些序列以及基因和蛋白质结构和功能的数据成为全世界科学界的宝贵资源和财富,这些海量的序列信息给高效、快速的基因发掘和利用提供了新的契机,在若干研究领域实现跨越式发展甚至“革命”的时机已经到来’。

但是,如何收集和处理这些 DNA 和蛋白质信息,并在作物改良中加以应用仍是一个巨大的挑战。

1.2 分子标记技术发展日新月异自20世纪80年代以来,先后开发出基于 Southern 杂交的第一代分子标记( RFLP 为代表)和基于 PCR 的第二代分子标记( SSR 为代表)。

随着植物基因组学研究的发展,全基因组序列、EST 及全长 cDNA 数量迅猛增长,成为开发新型分子标记的新资源。

因此目前全世界正在大力开发基于基因序列的第三代分子标记,即来自 cDNA 序列的 SSR 和 SNP 标记。

这类分子标记具有数目多、适于高通量检测的优点;更重要的是,由于 EST 和 cDNA 全长序列是表达基因序列,通过对现有的 EST 或全长cDNA 数据进行标记查寻,再进行合适的标记引物设计和多态性检测,就可以找到稳定可靠的基于表达基因的特定分子标记。

因为标记来自基因的转录区域,因此这些标记能更好地对基因功能的多样性进行更直接的评估。

cSSR 标记还具有一个优点,即部分标记可以跨物种应用,因为在不同物种中的表达基因大多数是相似的,针对这些表达基因设计的 SSR 标记就可以在物种间通用。

此外,根据 EST 序列信息或根据不同种质资源中的基因序列比较分析,还可以开发出针对特定等位基因的 SNP 标记,这些 SNP 标记将大大方便对有利基因的分子标记辅助选择。

1.3 基因和 QTL 定位研究广泛深入作物重要农艺性状大多是数量性状,受多基因控制,这些基因间存在复杂的相互作用,基因的表达容易受环境因素的影响。

分子标记技术的飞速发展,极大促进了基因定位特别是数量性状基因定位的研究,定位数量性状的基因位点( QTL ),阐明它们的效应、上位性以及与环境的互作,是当代遗传育种研究的一个重要方向。

目前,植物 QTL 定位方面应用较广的方法有:区间作图、复合区间作图和基于混合线性模型的复合区间作图等。

利用这些方法,对主要农作物的数量性状进行了大量的定位研究,截止2005年4月仅 CAB (国际农业和生物学中心文摘数据库)收录的各种 QTL 定位的论文就有3497篇,其中植物方面的 QTL 定位研究论文1581篇,研究比较深入的作物有水稻、玉米、小麦和番茄等。

研究者从不同角度分析了 QTL 的主效应、 QTL 之间的互作效应、QTL 与环境的互作效应等,采用的作图群体包括重组自交系( RIL )、加倍单倍体( DH )、F2 及其衍生群体、回交群体、随机交配群体和染色体片段置换系( CSSL )群体等;在此基础上,进行单基因分解、精细定位和图位克隆研究。

等位基因变异的检测与表型性状的深入鉴定相结合已成为从种质资源中发掘新基因的有效手段。

自1995年以来,Eshed 和 Zamir 倡导利用高代回交导入系结合定向选择,大规模发掘种质资源中有利基因,从而获取 QTL 的复等位基因在不同遗传背景下的表达效应,以便将 QTL 定位研究与植物育种紧密结合起来,为分子设计育种提供全面、准确的遗传信息。

1.4 基因电子定位与电子延伸得到应用利用 EST 或 cDNA 全长序列等信息对表达序列直接进行作图已成为发掘新基因和比较基因组学研究的重要途径之一。

EST 是目前发现新基因的主要信息来源之一,尤其是对尚未进行全基因组测序的小麦和玉米等作物来讲,EST 是了解基因组中基因序列特征、开发基因特异性标记的重要信息基础。

例如,通过把与抗病基因或防御反应基因相似的 EST 在水稻染色体上进行作图,发现部分 EST 定位在以前就已明确含有抗病基因的染色体区域。

通过 EST 序列还可以鉴定出那些编码特定代谢途径中的酶类基因,因此 EST 也是揭示作物代谢途径的重要方法。

NCBI 利用 BLAST 技术把 EST 数据进行了整理和分析,建立了 dbEST 数据库;为了更好地利用 EST 数据,NCBI 还根据基因序列对 EST 进行了分类,进一步建立了 UniGene 数据库,其中来自水稻、小麦和玉米的序列数分别为20607条、22959条和13193条(2003年7月数据)。

研究表明,通过将 EST 或 cDNA 全长序列等信息对表达序列直接进行作图,可以把不同基因定位在染色体上。

例如,Wu 等用6591个水稻 EST 进行了转录图的构建,明确了各表达基因在染色体上的位置。

这些数据与全基因组序列的基因注释信息结合起来,已使人们对水稻中的基因有了更清晰的认识。

1.5 转基因技术和标记辅助选择方法取得一定进展利用转基因技术进行作物品种改良已取得一定进展。

但是,目前转基因技术还仅限于利用主基因改良单一目标性状,对于由多基因控制的大多数重要农艺性状,转基因技术尚无法发挥其优势。

另一方面,国内外对分子标记辅助选择育种做了不少有益的尝试,但对主基因控制的性状,分子标记辅助选择并不比传统的选择方法有明显优势;对多基因控制的重要农艺性状,由于 QTL 在遗传上的复杂性、背景依赖性以及与环境的复杂互作,现有的 QTL 定位成果很难直接用于指导分子标记辅助选择育种。

2 我国开展分子设计育种的时机已经成熟模式植物拟南芥和水稻的全基因组序列测定的完成,使得植物基因组学研究由结构基因组向功能基因组等各种“组学”迅猛发展。

基因组学和蛋白组学借助生物信息学的力量让人们从分子水平上了解植物亚细胞生理活动及真核生物的多细胞是如何组成并实现其复杂的功能,各种“组学”把传统生物学迅速带入了系统生物学的新时代,这一革命性的改变催生了分子设计( m olecular design )的概念。

目前,已有许多研究机构在做前期准备工作,朝此方向发展。

美国农业部已投资在十几个研究单位建立各种作物的数据库,这些数据库的整合将成为未来分子设计育种的重要基础。

其他比较有影响的研究机构如美国的先锋公司、澳大利亚的昆士兰大学和CSIRO,以及国际玉米小麦改良中心在基因型到表型建模、基因型与环境互作分析及育种模拟等方面开展了研究。

相关主题