当前位置:文档之家› 下一代DNA测序技术研究进展综述

下一代DNA测序技术研究进展综述

深度DNA测序技术在基因组测序中的研究策略和进展摘要:回顾了经典DNA测序技术原理,重点阐述了深度测序技术在基因组测序中的研究策略,并结合目前比较常见的二代测序仪来分析比较相互之间的特点和优势,最后,对即将到来的三代测序法的研究进展给予了简单的介绍。

关键词:深度DNA测序基因组测序仪DNA测序技术的发展过程漫长而艰辛,然而,我们现在获取的大部分DNA序列信息还是依靠基于Sanger在1977年建立的“DNA双脱氧链末端终止测序法”的DNA测序技术获得的。

另外就是Maxam和Gilbert建立的“化学降解测序法”。

在过去的七年当中,DNA测序技术的发展至少受到来自四个方面的影响:首先是人类基因组计划的出现,这项计划的实施过程中,科学家们面临了巨大的经费问题,因为传统的Sanger测序法无论怎么优化,都无法大幅度降低测序的成本,这很大程度促进了人们对在测序过程中如何降低成本的技术方面的研究。

第二,人类以及其他主要模式生物参考序列数据库的建立使得短片段阅读(short-read)成为可能,这极大的促进了短片段测序技术的发展。

第三,新型分子生物学技术的不断涌现导致了越来越多的诸如RNA表达染色体构象等生物现象的出现,这就需要有高通量DNA测序手段去解释这些问题,这也极大的促进了新型测序技术的发展。

第四,其他学科领域的技术的发展,例如计算机技术,数据存储及分析技术,聚合酶工程技术等,极大地支持了DNA测序技术的应用。

本文主要是对目前新一代DNA测序(也叫深度测序)技术(Next-generation DNA sequencing technologies)的研究策略及目前国际DNA测序最新进展做一简要的综述。

1.Sanger测序法先来回顾一下经典的DNA测序法,从上世纪九十年代早期开始,几乎所有的DNA测序都是利用半自动化的毛细管电泳Sanger测序技术完成的(图1-a)。

后来出现了高通量测序法,这种方法首先要对DNA预处理,获取大量的待测序模板即质粒或PCR产物。

然后在测序一种发生测序生化反应,这个过程会产生大量长短不一(因为终止位点不一样),末端被荧光标记的延伸产物。

再用分辨率高的毛细管凝胶电泳分离这些延伸产物,通过对延伸产物末端四种不同荧光颜色的区分,利用计算机软件自动“读出”DNA序列。

但这种方法读取的碱基信息有可能是错的。

这种方法可以应用于序列分析,例如基因组组装或者找到突变位点,这很大程度取决于测什么和为什么测。

这种高通量的测序方法一般可以同时进行96或者384个样品的测定。

经过三十年的逐步发展,Sanger测序法达到了对1000bp 长的序列进行测序,并且每个碱基的准确度可以达到99.999%。

在高通量的鸟枪基因组测序中,每测一千个碱基就要花费0.50美元。

图1.传统的测序与新一代测序法的流程比较a.高通量鸟枪Sanger测序法,首先,基因组DNA被随机切成小片段分子,然后将小片段DNA克隆进质粒载体,再转化到大肠杆菌中,最后从培养的大肠杆菌中提取质粒测序。

在几微升的反应体系中完成测序反应,然后通过延伸产物的末端荧光标记进行识别来进行DNA序列读取。

b.鸟枪循环芯片测序法。

同样先将基因组DNA随机切割成小片段,然后在这些小片段DNA分子的末端连接上普通接头,制成polony芯片,每一个polony都含有一个小片段DNA分子的多个拷贝,很多个polony集合在一起就形成了一个polony芯片。

这样的话,一次测序反应中就可以同时对多个polony进行测序,后面就与Sanger测序法一样,获得完整的DNA序列。

2. 深度DNA测序法各种不同的DNA测序策略可以被归为以下四类:a.微电泳方法,b.杂交法,c.单个分子的实时观测测序法,d.循环阵列测序法。

在此,主要以二代测序法对照在各种商业产品(如454测序法(主要应用在454基因组测序仪中),Solexa技术(用于Illumina测序仪中),SOLiD平台(Applied Biosystems),Polonator测序仪Heliscope单分子测序仪。

)(表1)的循环阵列测序法简述一下。

循环阵列测序法可以简单的描述为:对充满DNA样品的芯片重复进行基于DNA的聚合酶反应操作和碱基成像数据收集。

2005年Science和Nature各有一篇文章详细报道了这种方法,由于这种方法相对于传统的测序方法速度更快,成本更低,因此,在之后的几年中,这种方法被人们广泛的应用。

表1.各种测序技术Annu.Rev.Genomics Hum.Genet.2009.10:135–51尽管这些测序平台在在实际的生产及操作过程很不相同,而且各有特点,但他们的背后的工作原理是很相似的(图1-b)。

新一代测序法第一步也是将基因组DNA随机切割成小片段DNA,然后在这些小片段DNA分子的末端连接上普通接头,也可以制成跨步文库(jumping library),然后使用原位polony(situ polonies),微乳液PCR(Emulsion PCR)或桥式PCR(Bridge PCR)等方法获取测序模板(图2)。

这些方法的共同点就是任何一个小片段DNA分子的PCR扩增产物在空间上都是聚集的:桥式PCR和原位polony 测序法中的产物都是集中在平板的某处,而Emulsion PCR的产物则集中在微珠的表面。

而事实上,这些方法的测序反应则与传统的测序反应是一样的。

下面就简单介绍几种目前前沿的测序仪的工作模式及优缺点。

图2.克隆扩增模板片段a.广泛应用于454测序仪,polonator测序仪和SOLID测序仪上的用来扩增模板片段的微乳液PCR技术示意图。

第一步,体外构建好两端连接有接头(途中金色和绿色所示)的DNA文库,置于一个油包水的乳液环境中。

第二步,在此环境中进行PCR扩增,因为这里只是用了一对接头的引物,因此进行的是多模板PCR(muti-template PCR),而不是多重PCR,加之由于在模板浓度很低的情况下,大部分微珠的微乳液中最多只能有一条引物,因此经过PCR扩增后,每一个微珠表面上都只会连接上一种模板分子的扩增产物。

最后,打破微乳液滴,收集有大量模板分子的微珠制成芯片。

b.Illumina测序仪中使用桥式PCR技术示意图。

首先,体外构建好两端有接头的DNA文库(如图中金色和绿色所示)。

然后通过密集固定在载体上的引物(引物的5’端利用一个柔性接头连接在载体上)进行PCR 扩增,这样扩增产物也会在载体上。

PCR反应结束之后,每一个模板克隆都包含有1000个模板,精确的测量模板浓度对保证模板簇的密度最大化以及避免拥挤是非常关键的。

2.1 454测序仪454测序仪的最基本的原理是焦磷酸盐检测的原理,这是在1985年首先提出来的,然后1988年就有报道利用这个原理形成一个系统来进行DNA 测序。

在随后的很多年里,这个原理在M. Ronaghi等人的努力下在技术上取得长足的进步,并于2005年454基因组测序仪器正式问世。

在这个系统中(图3),其基本的流程在之前已有所叙述,因此此处不再赘述。

只说说其在DNA测序发展历程中的地位及现状。

454测序仪的出现极大地促进了测序业务的开展,454测序技术问世后,很快就成为科学家们解决科学问题的利器,他突破了传统测序法在文库制备,模板制备,测序上的瓶颈。

454测序仪的优点在于:第一,解决了高通量测序的问题;第二,缩小了测序反应的体积,降低了试剂的使用量,因此,这种测序方法成本相对传统测序法是极其低廉的。

而目前的454测序仪读取DNA片段的长度已达到400bp-500bp之间。

而接下来即将升级的454测序仪的数据输出将达到100Mb到500Mb左右。

454测序仪技术是继Sanger测序技术之后出现的第一个用于对细菌基因组进行从头测序的新技术,也是第一个被用来对人类基因组进行测序的非Sanger测序技术。

有关其具体的信息可以在上查阅。

图3. A. GS454 DNA测序仪的流程图。

B.454测序的基本原理示意图。

2.2 Illumina 测序仪Illumina 测序仪通常也称为Solexa 测序仪,最早是由Turcatti ,他的同事2005年报道的,由四家公司—Solexa(Essex,UK), Lynx Therapeutics(Hayward,CA,USA), Manteia Predictive Medicine(Cionsins ,Swizerland)和Illumina 的合并公司生产出来的。

Illumina 测序仪的特点是:1.对于检测同聚物来说,Illumina 测序仪要比454测序仪好很多;2.Illumina 测序仪的平均出错率是1%-1.5%,不过可以通过质量优化将错误率降低到不倒0.1%,其在36bp 的准确里极高;3.与其他测序仪一样,经过改进后,Illumina 测序仪也能进行配对检测;4. Illumina 测序仪在测序长度方面有所缺陷,因为核苷酸上标记的荧光基因或终止基因切除不完全导致测序信号发生了衰减和相移;5. Illumina 测序仪在检测碱基替换突变中易出错,另外还有检测插入或缺失突变时都容易出错。

Illumina 测序仪可以利用桥式PCR ,但与传统的桥式PCR 不同,这种桥式PCR 交替使用Bst 聚合酶进行延伸反应,并使用甲酰胺进行变性反应。

Illumina 测序仪经过PCR 扩增以后,所有的模板都会被线性化形成单链模板,后面的步骤基本与454测序法相似。

图4.Solexa 测序仪使用桥式PCR 直接在芯片进行模板片段扩增然后同时加入四种经过修饰的脱氧核苷酸,每一个核苷酸都携带一种荧光基因和一个可被取去除的终止基因,经过修饰的DNA 聚合酶催化引物延伸测序反应,采集图像然后切除荧光标记基团和终止基团,重复上述反应,完成测序。

2.3 AB SOLiD 测序仪这个平台最开始是由J.S 及其同事在2005年报道的,然后于2006年首次应用Mckernan 的实验室,是由Applied Biosystems公司生产的,也是Nature biotechnology volume 26 number 10 OCTOBER 2008使用微乳液PCR方法扩增模板片段的,但是使用的是直径1微米的小磁珠。

AB SOLiD测序仪可以对任何方法制备的DNA文库进行测序,它可以将富集有模板片段的微珠进行高度可控的任意排列。

AB SOLiD测序仪后期的合成测序法是由DNA连接酶完成的,并不像其他测序法一样,是由DNA 聚合酶完成的。

基本步骤如下图(图5)所示。

AB SOLiD测序仪还有一个特点,即运用了双碱基编码技术,这种技术可以校准误差,因为它是用两个碱基来对应一个荧光,因此,出错的概率会大大降低。

相关主题