当前位置:文档之家› 宏基因组学的一般研究策略

宏基因组学的一般研究策略

宏基因组学的一般研究策略摘要: 宏基因组学是目前微生物基因工程的一个重要方向与热点。

它把微生物的总群体特性与基因组学实验手段结合了起来,包括从环境样品中提取总DNA、再用可培养的宿主微生物建立文库及筛选目的克隆和基因。

该法是研究不可培养微生物、寻找新的基因和开发新活性产物的重要新途径。

它避开了微生物分离、纯化和培养的步骤,大大扩展了微生物资源的利用范围。

本文旨在介绍宏基因组学的一般研究方法并结合我们的实验情况,对这一崭新领域中的最新研究策略进行了简要综述。

关键词: 宏基因组学, 不可培养微生物, 文库构建, 文库筛选,研究策略Strategies for accessing metagenomics for desired applicationsAbstract: Metagenomics is a new field of microbial genetic engineering. It has the characteristics of microbial ecology and the methodology of genomics. Metagenomics includes genomic DNA isolation, library construction and screening strategies, and can be used in the discovery of new gene and biocatalysts and in the study of uncultured microorganism. Metagenomics can overcome the advantages of isolation and cultivation procedures in traditional microbial method, and thus greatly broaden the space of microbial resource utilization. In this paper, we mainly reviewed the metagenomic methodology, together with the latest advances and novel strategy in this research field.Keywords:Metagenomics; Uncultured microorganism;Library construction;Library screening Research strategies大自然中蕴藏着无数具有重要价值的微生物及其活性产物,也是新基因及生物学资源的重要源泉,对其进行研究成为微生物学和分子生物学研究的一个重要方向。

然而人们现在能够培养与利用的不到环境中总微生物的1%[1]。

宏基因组学(metagenomics)是直接从环境样品中提取全部微生物的总DNA, 避开了分离、纯化和培养微生物的过程来构建宏基因组文库,用基因组学的研究策略来研究环境样品中的总微生物的组成及其在群落中的功能等。

现在,宏基因组学技术方法已在微生物多样性,微生物细胞间的相互作用,新基因和新型生物催化剂的开发,新的抗生素的开发及环境生态等方面得到了广泛应用[2]。

本文旨在介绍宏基因组学的一般实验方法并结合我们的研究情况,对这一崭新领域中的最新研究策略进行了简要综述。

深化了我们对这一学科的认识,促进了该学科的进步。

1 宏基因组学研究策略1.1宏基因组学概要宏基因组学是Handelsman等于1998年提出的[3], 可见是一门很新的学科,其随着基因组实验手段,生物信息学和测序技术等的日新月异也迅猛发展了起来,这个新学科是以环境样品的总微生物基因组为实验对象,通过测序分析、文库评价、产活性物质及其基因的克隆的获取和基因功能的鉴别,对微生物种群组成与生物量、生态学关系、生物化学关系与环境关系以及功能活性进行研究[4]。

其主要过程包括样品和基因的富集和提取; 宏基因组文库的构建; 目的基因的筛选; 目的基因活性产物的表达(图1)。

1.2 微生物及其基因的富集在文库筛选过程中由于目的基因比例较小, 对环境中微生物的富集不但可提高基因总量,有利于基因的提取,还可增加目的基因的比例,如Kouker 等用橄榄油富集产脂肪酶的微生物收到了很好的效果[5 ],橄榄油不仅可作为底物,还可诱导脂肪酶的合成。

目前富集技术主要分为细胞水平和基因水平。

其中细胞水平主要是用选择培养基来富集某些微生物, 常图 1 环境微生物宏基因组学研究策略[6]Fig. 1 General process of metagenomic strategie[6]用的就是上面例子中的底物选择法[5]。

每一个事物都有其两面性,富集培养虽然扩大了基因的总量,却很容易使部分微生物及其携带的基因丢失。

基因水平富集中的稳定同位素探针技术(SIP)很有代表性, 它是用稳定同位素标记底物, 用相对量较大的原子掺入到具有活性的核酸里,采用密度梯度离心法将其分开, 标记的核酸可作为PCR的模板,用来构建宏基因组文库[7]。

目前,SIP与宏基因组学结合的报道还不多,但其潜力与优势很明显,利用SIP可提高新基因发现的几率。

1.3 环境中总DNA的提取宏基因组学要分析的样品成分复杂,要获得高浓度、大片段、无偏好的总DNA是宏基因组学技术的难点,也是其重点。

现在提取DNA的方法大体有两种: 其一是直接提取法, 又称原位提取法,它用化学和物理方法直接裂解样品中的微生物使DNA得以释放,再抽提总DNA,并对DNA进行纯化。

其中以Zhou法[8]和Tsai[9]法最为常用。

该法操作简便、省时、成本低,能代表某一生境的微生物群落多样性。

其缺点是会出现细胞裂解不完全或DNA 与样品杂质共沉淀而难以分离, 故一般要再进行DNA纯化这一步,它所提取的DNA片段较小(1 kb~50 kb), 适合小片段文库的构建; 其二是间接提取法, 即异位提取法,是采用差速离心等方法将细胞从样品中分离出,再提取DNA, 该法获得的DNA纯度高、DNA 片段大(20 kb~500 kb), 适合构建大片段的基因文库。

但操作繁琐、成本高、DNA 产率低且有偏嗜性, 其产率只是上一种方法的1%~10% [10], 其总DNA往往不能完全代表样品所在生境的生态学多样性。

可见两种方法各有利弊,应根据具体实验灵活选择,一般较好提DNA的液体样品才用后者。

本实验室通过实验研究得出:一般而言,直接裂解提取法效率较高, 不易丢失物种信息,能够获得25 kb 左右的DNA 片段。

间接法提取效率较低, 容易丢失基因信息。

因此我们建议采用直接提取法获取总DNA。

我们还采用低熔点琼脂糖包埋法提取水样中的大片段DNA,其大小在50Kb以上。

单一包埋块中的DNA含量较小,我们把多个琼脂糖包埋块放在一起后用酶法纯化浓缩,大大提高了DNA的总量,收到了很好的效果。

1.4文库的构建1.4.1载体的选择: 现在用于DNA克隆的载体有质粒、Fosmid、Cosmid、BAC、YAC和噬菌体等,可由DNA纯度、片段大小、质粒特性、宿主菌及筛选方法等灵活选择。

质粒可用于克隆小于10kb的DNA片段,对较大的基因或由多基因簇构成的DNA可以建立Fosmid 文库[11-13]和Cosmid 文库[14]。

BAC和Y AC的容量可达200 kb~450 kb[15]。

但YAC载体存在着比较高的嵌合体(占全部克隆的40%~60%),转化效率低,稳定性差,插入片段分离与纯化比较困难[15]。

BAC、PAC、MAC和人类人工染色体HAC等载体系统克服了以上缺点。

一般认为BAC是其中较好的。

Fosmid 质粒上带有 E.coli F 因子单拷贝的复制原点和需诱导的高拷贝oriV 复制原点,其表达受一个严谨条件诱导的启动子的控制。

我们可通过诱导Fosmid阳性克隆高效表达的方法获得大量质粒,便于提取功能DNA,进而进行序列和酶学特性的分析,而不需要再建亚克隆。

我们通过大量实验摸索出了Fosmid质粒的较佳的应用条件,其效果优于其它载体。

1.4.2 宿主细胞的选择: 不同种类的微生物所产的活性物质不同。

选择宿主时应考虑转化效率的高低、重组载体的稳定性、外源基因能否有效表达、目标性状是否缺陷等。

目前,E. coli 是应用最多的宿主[16.17], 其背景清楚、操作简单、繁殖快、易培养。

为了表达真核外源基因我们实验室改进了酵母和CHO等表达系统且效果明显,它们是表达真核修饰蛋白(如市售的很多药物蛋白)的重要研究方向。

现在有人利用链霉菌、假单胞菌等作为表达新抗生素的宿主效果较好[18]。

我们可根据目的产物不同灵活选择宿主菌,一般而言,若要开发新型生物催化剂则用E. coli[19],若开发的是新的抗生素等药物则选择亲缘关系很可能较近的链霉菌等。

1.5文库的筛选活性克隆子的筛选是宏基因组学技术的又一重点和难点。

高通量的筛选策略能否应用成功是实验成败的关键。

由于生物的个体性很强,导入宿主菌的基因可能缺乏有效的转录、翻译以及蛋白转运分泌机制,也可能由于翻译后加工机制不完善,或宿主缺乏必要因子及存在密码子的偏嗜性等将直接影响筛选的效率和灵敏度[20],给宏基因组文库筛选带来了很大的挑战。

目前筛选策略主要有一下两种:1)基于序列的筛选方法,该法用到了生物信息学,由已知的同源性很近的基因的序列设计探针或PCR引物,再用杂交或PCR扩增等技术筛选出目的基因, 该法是筛选保守性较高的生物催化剂的有效方法。

它克服了功能筛选法中对活性产物的有效表达的依赖。

其中PCR 扩增技术是最常用的[21]。

这一方法是根据保守和已知DNA序列设计的,所以它的缺点是被筛选出的新基因总是与已知基因相同或类似,或扩增的特异性不强,筛选效果不理想,且难以获得完整的功能基因。

现在基因芯片技术和优化的随机鸟枪法筛选效果也很令人信服。

序列依赖性筛选法被看作是极具潜力的一种筛选方式。

很多研究者在此方面作了改进,譬如应用穿梭载体表达外源基因,从而使宏基因组DNA 利于通过多种宿主进行筛选,或者对大肠杆菌做适当修饰以增加基因表达的范围。

2) 基于功能的筛选方法,这一种方法利用外源基因表达产物的活性来筛选阳性克隆,即采用各种活性检测手段挑选有活性的克隆子,进而对其进行研究分析。

现在大部分的新型生物催化剂都是利用这种方法筛选得到的。

人们已经在选择性平板上筛选到了脂肪酶、淀粉酶、蛋白酶及抗菌活性的克隆子[22,23]。

本方法中有一种有效的筛选方式是构建报告融合子[24],可将提取的总DNA随机克隆到无启动子的绿色荧光蛋白基因(GFP)前面, 运用荧光激活细胞分离(FACS)技术, 在添加特定底物的情况下富集筛选阳性克隆。

相关主题