新一代测序法简介新一代测序方法是一种直接测序法,它既可以分析基因和DNA的组成(定性分析),也可以测定同一类型基因在表达过程中产生的数量(定量分析),以及不同类型基因或DNA 之间的差别所在(交叉对比分析)。
自2004年,454测序技术发展以来,已经出现的测序产品超过六种之多。
这些产品的技术特点见下表:产家名称产品技术特点优缺点化学反应测序方法误读率样品准备高通量程度Roche(454 Life Science) 焦磷酸标记的链反应焦磷酸基标记<1% 较复杂,需PCR 中等Illumina(Solexa)四色可逆终止码合成法1%—3% 较复杂,需PCR 中—高ABI(SOLID) 双色可逆终止码合成法1%—5% 较复杂,需PCR 中—高Helicos Bioscience 单色可逆终止码合成法2%—8% 简单,无需PCR 高—超高Intelligent Biosystm 四色可逆终止码合成法1%—5% 较复杂,需PCR 中—高Pacific Bioscience 四色焦磷酸基标记焦磷酸基标记3%—8% 简单,无需PCR 高VisiGen 焦磷酸基标记FRET 焦磷酸基标记3%—8% 简单,无需PCR 高在这些技术中,从所分析的样本在测序前是否需要扩增,大致可以分为两类,即克隆扩增型和单分子测序型。
两种类型在测序技术上区别并不大,但对结果的影响却有不小的差别。
主要体现在两个方面:(1)单分子测序更能反应细胞或组织内分子的真实情况,尤其是在需要定量分析的情况下。
而克隆扩增型中的PCR反应使得样品中DNA分子的扩增机会并不完全均等,这会对基因表达的定量分析造成影响;(2)单分子测序具有通量更高的优势。
克隆扩增使得同一类型的分子数目急剧上升,在提高同类型分在在固相表面出现的几率同时,也降低了不同类型分子出现的机会。
面重点介绍Pacific Biosciences公司推出的Single Molecule Real Time (SMRT™) DNA Sequencing(单分子实时DNA测序)。
首先,在这一测序技术中有主要有两个关键的技术:一、荧光标记的脱氧核苷酸避免了碱基的空间位阻效应。
显微镜现在也无法实现实时看到“单分子”,但是它可以实时记录荧光的强度变化。
当荧光标记的脱氧核苷酸被掺入DNA 链的时候,它的荧光就同时能在DNA链上探测到。
当它与DNA链形成化学键的时候,它的荧光基团就被DNA聚合酶切除,荧光消失。
这种荧光标记的脱氧核苷酸不会影响DNA聚合酶的活性,并且在荧光被切除之后,合成的DNA链和天然的DNA链完全一样;二、纳米微孔(Zero-mode waveguide (ZMW))。
因为在显微镜实时记录DNA链上的荧光的时候,DNA链周围的众多的荧光标记的脱氧核苷酸形成了非常强大的荧光背景,这种强大的荧光背景使单分子的荧光探测成为不可能。
Pacific Biosciences公司发明了一种直径只有10nm的纳米孔,单分子的DNA聚合酶被固定在这个孔内。
在这么小的孔内,DNA链周围的荧光标记的脱氧核苷酸有限,而且由于A,T,C,G这四种荧光标记的脱氧核苷酸非常快速地从外面进入到孔内又出去,它们形成了非常稳定的背景荧光信号。
而当某一种荧光标记的脱氧核苷酸被掺入到DNA链时,这种特定颜色的荧光会持续一小段时间,直到新的化学键形成,荧光基团被DNA聚合酶切除为止。
另外,Pacific Biosciences公司还对这一技术进行了进一步的优化:一、把双链DNA环化反复测序。
人们可以在双链DNA的两头连上发夹结构的DNA adaptor,从而使DNA环化。
而DNA聚合酶就能够以环化的DNA作为模板滚环复制,反复测一段DNA序列。
这种反复测序,纠正了偶尔出现的复制错误,从而使测序精度非常高。
二、激发光中断测序法。
DNA聚合酶虽然很稳定,但是在强大的激发光作用下酶也是有一定寿命的。
如果把激发光中断一段时间,在这段时间内DNA聚合酶继续复制DNA,当激发光重新开启以后,人们就可以测到长DNA链后面的序列。
新一代测序技术相比传统的测序方法,进步是极其明显的:(1)它实现了DNA聚合酶内在自身的反应速度,一秒可以测10个碱基,测序速度是化学法测序的2万倍;(2)它实现了DNA聚合酶内在自身的延续性,一次可以合成很长的片段,一个反应就可以测非常长的序列。
目前最快的测序技术可以测几千个碱基,是传统的方法的十几倍,这为基因组重复序列的拼接提供了非常好的条件。
(3)它的精度非常高,达到99.9999%。
此外,有些新一代测序技术(如Pacific Biosciences公司推出的Single Molecule Real Time (SMRT™) DNA Sequencing)还有其它二代测序所不具备的优势:一、直接测RNA的序列。
既然DNA聚合酶能够实时观测,那么以RNA为模板复制DNA 的逆转录酶也同样可以。
RNA的直接测序,将大大降低体外逆转录产生的系统误差。
二、直接测甲基化的DNA序列①。
实际上DNA聚合酶复制A、T、C、G的速度是不一样的。
正常的C或者甲基化的C为模板,DNA聚合酶停顿的时间不同。
根据这个不同的时间,可以判断模板的C是否甲基化。
Pacific Biosciences公司预计2010年或者2011年就会推出商业化的测序仪器。
在不远的将来,如果他们能和二代测序一样集成100万个纳米微孔,那么一台仪器15分钟就能够准确地测出一个人的基因组。
以后每个人的基因组测序成本将变成100美元,人人都可以消费得起。
相比人类基因组计划耗资30亿美元,费时十几年,无数科学家参与其中,这些技术的革新意义的重大性显而易见。
在单分子测序技术处于进步的过程中,它也同样面临来自各方面的一些挑战:一、在工程技术领域,如何能够更快更准的记录测序反应的结构。
绝大多数生物学反应都必须在液相中进行,但是如何在固相表面建立有效的反应并准确及时地记录下来,这不仅是工程学(如极微量流体传送),而且也是光学技术(如激光扫描成像)和信息技术上的挑战。
目前,Pacific Biosciences公司发明的共聚焦显微镜可以实时地快速地对集成在板上的无数的纳米小孔同时进行记录,解决了部分问题。
二、在化学和生物工程领域,如何使得测序反应更准确和可控制。
现有的单分子测序技术主要是通过修饰核苷酸或DNA聚合酶来控制反应对于核苷酸的修饰有两种情形:一种是是可逆转的终止码(reversible terminator),在核苷酸的碱基段装配有一个荧光基团,同时将37.OH端覆盖上化学基团使之不能立即进行下一步聚合反应(也有可逆性终止码不采用这一步修饰)。
这种经过修饰的核苷酸(可逆性的终止码),在DNA聚合反应发生时,可以象正常核苷酸一样被聚合到正在延伸中的核酸反应链末端,但却阻止下一步的链接反应,直到其上的荧光物质和化学基团被清除。
通过对可逆性的终止码的“链接—清除—链接”的循环操作来达到控制测序反应的目的,是该类测序技术的典型特征。
应用这一类型技术的公司有ILLUMINA、ABI/SOLID、HELICOS和INTELUGENT BIOSYSYSTEM等。
与可逆性的终止码不同,另一种核苷酸修饰技术是通过将荧光基团装配在核苷酸的磷酸基上而不是碱基上。
测序反应时,磷酸基修饰的核苷酸完全象正常的核苷酸一样起反应,三磷酸核苷酸转变为单磷酸核苷酸而延长DNA链,并释放出焦磷酸基。
由于释放出的磷酸基带有代表碱基特征的标志荧光,因此碱基序列得以记录下来。
比较两种方法可以得出这样的推断,磷酸基修饰法能使测序反应更省时省钱,因为它省去了可逆性的终止码所需的清除和清洗的步骤。
使用该方法的公司目前主要是PACIFIC BIOSCIENCES和VISIGEN。
除此之外,还有直接利用焦磷酸基触发反应底物而产生荧光的方法(pyrosequeneing)或其它方法如FRET等。
由于修饰后的核苷酸在分子结构、大小和质量上与天然核苷酸之间有不小的差别,因此在测序反应中有可能产生错配的现象。
对于处理这种情况可以从两方面入手,一是尽量让修饰过的核苷酸在结构上尽可能接近天然核苷酸;二是通过生物工程方法修饰DNA聚合酶,使之能够正确有效地识别人工核苷酸。
三、在生物信息领域,如何自动快速处理巨量的DNA序列信息。
具体的挑战:首先是信息量巨大。
原来需要数月甚至整年才能获得的信息,新一代测序技术也许只要数小时或数天就能获取。
巨大的信息需要及时得到读取和解释。
其次,超短测序序列(25-35BPS)比对与分析,以及由序列信息到生物学和医学的检测基本信息之间要有分析和连通过程。
再次,处理上述信息需要有新的计算方法和程序。
注①:在甲基转移酶的催化下,DNA的CG两个核苷酸的胞嘧啶被选择性地添加甲基,形成5-甲基胞嘧啶,这常见于基因的5'-CG-3'序列。
大多数脊椎动物基因组DNA都有少量的甲基化胞嘧啶,主要集中在基因5'端的非编码区,并成簇存在。
甲基化位点可随DNA的复制而遗传,因为DNA复制后,甲基化酶可将新合成的未甲基化的位点进行甲基化。
DNA的甲基化可引起基因的失活。
DNA甲基化是研究最为深入的表观遗传学机制,DNA甲基化在维持正常细胞功能、抑制重复序列和寄生DNA成分对基因组完整性的损害、染色质结构修饰、X染色体失活、胚胎发育、基因组印迹以及人类肿瘤发生中起着重要作用,是目前新的研究热点之一。