下一代测序技术摘要|从未有过的巨大革命技术需求交付快速、廉价、准确的基因组信息。
这一挑战也促进了下一代测序技术的发展。
传统方法主要的优势是生产大量廉价的序列数据。
在这里,我进行一下技术回顾,模板制备、测序成像、基因定位和装配方法以及当前的最新进展和短期商用的下一代测序技术。
除了为解决生物问题的兴趣提供平台选择指导,再略述下一代测序技术的广泛应用。
在过去的四年里,进行基因组分析的自动化桑格测序技术的应用发生了根本性的转变。
在这之前,自动化桑格技术主导该产业几乎20年,并作出了巨大的成就,包括唯一完整的人类基因组序列。
尽管在这个年代很多技术都在提高,然而自动化桑格测序技术的局限性,展现出对一种面向大量人类基因组测序的新的改良技术的需求。
最近致力于研究新的方法,桑格测序可能提的会少一些。
因此,本篇文章不包括桑格测序,有兴趣的读者可以读一下前面的文章。
自动化桑格方法被认为是“第一代”技术,新的方法被称为下一代基因测序。
这些新技术组成不同的策略,依赖于模板准备,测序和成像,基因组比对和装配的方法结合。
下一代测序技术的到来改变了我们在基础、应用和临床研究方面的思考方式。
在某些方面,下一代测序技术类似于以前的聚合酶反应链,主要使用局限在成像方面。
下一代测序技术的提高在于其能廉价地生产出一个巨大的数据量,在某些情况下仪器运行超过十亿短读。
这个特性扩展了实验以外的领域,不仅仅是在确定的顺序集上。
例如,基因表达研究基因芯片现在被基于序列的方法所代替,这种方法可以识别和量化罕见的转录体,没有先验知识的一个特定的基因,并且提供特定基因的可变剪接和序列变化方面的相关信息。
测序许多相关生物的整个基因组的能力使得大规模的比对和进化研究被实施,这在几年前是不可想象的。
下一代测序技术最广泛的应用可能是对人类基因的重新排序以增强人们对不同的基因如何影响健康和疾病的理解。
下一代测序的各种特性使得它在市场上可能共存于多个平台,因为它在特定应用上有明显的优势。
本文专注于商用技术,来自罗氏/454,lllumi na/ Solexa,LIFE/ AP窃口Polonator Helicos生物科学仪器和近期的太平洋生物科学,旨在2010年将他们的测序设备引进市场。
纳米孔测序没有被覆盖,尽管有兴趣的读者通过布兰顿和他的同事们针对一篇文章,描述了进展并对这项技术保持挑战。
在这里,我提出一个技术的回顾,模板准备,测序和成像,基因组比对和装配,当前下一代基因测序平台的性能,为这些技术如何工作和如何将这些技术应用于重要的生物问题上提供指导。
我强调用目标和整个基因组方法进行人类基因组重组的应用,讨论这些方法的进展和局限性,和接下来几年即将看到的进展和预期的影响。
下一代测序技术测序技术包括很多方法,宽泛的分为模板准备,测序和成像,数据分析。
特定协议的独特结合使得一个技术区别于其他技术,决定着来自每个平台产生的数据类型。
当基于数据的质量和成本比较时这些输出数据的不同面临挑战。
尽管质量分数和精度估计是由每个制造商提供的,从一个平台到另一个平台“质量基础” 是没有一致性的。
下文将会讨论各种测序指标。
在下面几节中,讨论模板准备和测序成像,因为它们适用于现有和近期的商业平台。
下面有两种方法用于为下一代测序反应准备模板:从单个DNA分子克隆扩增的模板,和单个DNA分子模板。
合成测序,在文献中用于描述大量的脱氧核糖核苷酸的方法,在这篇文章中,因为它无法描述测序中的不同机制,所以没有用到。
相反,这些方法被列为循环可逆终止(CRT,单基因(SNA和实时测序。
还描述了结扎测序(SBL,一种由DNA连接酶替换DNA聚合酶的方法。
成像方法再加上这些从测量生物发光信号到单核分子的四色成像事件测序策略。
下一代测序平台产出大量数据代替了信息技术在数据存储,追踪和质量控制方面的大量需求。
模板准备需要一个健壮的方法产出一个代表,基因组在调查过程中再怎么强调核酸物质的无偏来源都不为过。
目前的方法通常致力于随机的将DNA基因组破坏为较小规格的DNA从中创建片段模板或是双端模板。
在下一代测序技术中的一个普遍主题是模板固定或支撑在固体表面。
空间的固定分离了模板珠允许数十亿的测序反应同时进行。
克隆扩增模板大多数成像系统没有被设计为检测单一的荧光事件,所以需要扩增模板。
两种最普通的方法是感光乳剂聚合酶链反应和固相扩增。
感光乳剂聚合酶链反应被用于在非细胞系统准备测序模板,有利于避免基因组序列的任意损失。
在细菌克隆方法中存在一个固有的问题。
一个片段或配对库被创建后,转接器包含通用的启动点,被绑定在目标末端。
允许复杂的基因组用普通的聚合酶链反应引物进行扩增。
绑定之后,DNA被分离成单股并捕获到每个支持一个DNA 分子的点的情况。
在成功扩增和改进感光乳剂聚合酶链反应后,数百万可以固定聚丙烯酰胺凝胶在一个标准的显微镜幻灯片上,化学的交联在一个氨基酸镀膜玻璃表面或者很好地沉积成单个下一代测序化学过程可以被执行的蛋白酪氨酸磷酸酯酶(PTP。
固相扩增也可用于随机分布的生产,克隆扩增的集群来自一个载玻片的片段或配对模板。
高密度的正向反向引物共价键覆在滑片上,支撑物上引物模板的比率界定了扩增集群的表面密度。
固相扩增能产出1、2亿空间上分离的模板集群。
为能被混合生成到启动下一代测序反应的一个普通的测序引物提供游离末端。
单一分子模板尽管克隆扩增方法在细菌克隆方面提供了一定的优势。
有些协议实现繁琐,要求大量基因组DNA原料。
单一的DNA分子模板准备起来更加直接,只需要少量的启动原料。
更重要的是,这些方法不需要聚合酶链反应,在克隆扩增模板时突变,伪装为序列变体。
AT-rich and GC-rich目标测序可能也展现了生产领域的扩增偏见,导致在基因组比对和装配代表不足。
定量应用,例如RNA 测序,与未扩增的模板资源,更有效的执行,不改变表征丰富的信使RNA 分子。
在下一代基因测序未实施之前,单核分子模板通常固定在固体支撑上至少使用三个不同的方法之一。
在一个方法中,空间分布的单个引物分子共价附着在固体支撑上。
模板准备通过随机分割启动原料至小规模,加上普通的转接器到片段末端,混合生成固定的引物。
在第二种方法中,空间分布单个分子模板键和固定在固体支撑上,通过引发扩展单链,从固定化引物到单核分子模板。
一个普通的引物就被混合生成模板。
在这两种方法中,DNA聚合酶绑定固定的引物模板配置最初的下一代测序反应。
以上两种方法都在螺旋生物科学中用过。
在第三种方法中,空间分布单个聚合酶分子固定在一个引物模板分子被绑定固体支撑上。
这种方法被太平洋生物科学用过,在Life/visiGe n 16 and LI-CO生物科学专利中描述过。
这种技术可用于大的DNA分子,不像前两种方法,第三种能用于实时方法,导致潜在的长读取长度。
测序和成像测序克隆扩增和单核分子模板有着本质的区别。
克隆扩增导致同一模板种群,每个都经历了测序反应。
成像,所观察到的信号是在给定周期中附加到相同的模板的核苷酸或探针的共识。
这代表在效率增加过程中一个更大的需求,模板总体效果的不完整扩充后随链移相。
另外多个核苷酸或探针也发生在一个即定的周期,导致领头链移相。
信号移相增加了荧光噪音,造成碱基判定错误和较短读取。
因为移相不是一个用于单分子模板的事件,为了循环效率的要求放宽。
然而,在任何既定的周期中单核分子易受多个核苷酸或探针增加的影响。
这里,删除错误被在毗邻的染色分子或无信号被检测到因为黑核苷酸或探针的合并。
在接下来的一部分,测序和成像策略将用克隆扩增和单核分子模板来讨论。
循环可逆终结顾名思义,循环可逆终结是在一个循环方法中用可逆终结来使核苷酸合并,荧光成像和分裂。
在第一步中,一个DNA聚合酶,结合启动模板,添加或是合并仅仅一个荧光改变核苷酸,作为对基础模板的补充。
在单核核苷酸增加之后DNA合成终结是CRT的一个重要特征。
合并之后,剩余的未合并的核苷酸被冲洗。
成像用来决定合并后的核苷酸的身份。
通过一步分裂,消除了终止/抑制组和荧光染料。
另外的冲洗是在下一个合并开始之前被执行。
CRT方法的核心是可逆结束符,分为两步:3端封锁和3'端未封锁。
双脱氧核苷酸在桑格测序中充当着一个链结束符的角色,链接在核苷酸3末端,为初始的反转圭寸锁组发展提供基础。
圭寸锁组,such as 3 -0-allyl2' -deoxyribonucleosidetriphosphates (dNTPs) 21 and3 -O-azidomethyl-dNTPs,已被成功用在了CRT 中。
3封锁结束符要求两个化学键的分解来消除来自核苷酸的荧光和恢复3' -OH 组。
目前,lllumina公司/ Solexa基因组分析仪(GA)23在门店市场上占据主导地位。
它使用克隆增强模板方法,耦合四色CRT方法。
这四个颜色通过全内反射荧光(TIRF使用两个激光成像探测到,输出在图二中描述。
玻片被划分为八个频道,它允许独立样本同时运行。
表一展示了当前Illumina/Solexa GA II平台在贝勒大学医学院人类基因组测序中心上运行的测序数据。
替换是最普遍的错误类型,大部分错误发生在最早合并核苷酸是''基。
lllumina/Solexa数据的基因组分析揭示了AT-rich和GC-rich区域代表不足,很可能由于模板准备期间的扩增偏差。
通过生物信息工具如mAQ或eLAND,比对读取参照基因组称为序列变异。
宾利和他的同事们记录了单核核苷酸变体(SNV很高的一致性(99.5%),用相同的比对工具进行标准基因型分析组,和异常的假阳性率为 2.5%的单核核苷酸变体。
其他的记录者描绘了用这些比对工具更高的异常单核核苷酸变体假阳性率。
困难包括识别一个有效合并3'封锁末端的修改了的酶--需要筛选大的突变DNA聚合酶库--促使了3未封锁端可逆末端的发展。
LaserGen,lnc.是第一组展示一个小终止组相连的畅通无阻的核苷酸 3 '端可以作为一个有效的可逆的终结者,通过原生DNA聚合酶合并。
这促使了快速终止剂的发展。
Helicos是生物科学报道了虚拟终止剂的发展,3'畅通终端与第二个核苷类似物作为抑制剂。
3' 畅通终端面临的挑战是创建适当的修改终止(快速终止剂)或抑制组(虚拟终端)以使得DNA合成在单基添加后结束。
一个未封锁的3'-OH组重要是因为它为下一个核苷酸的合并提供了天然基质。
单键的分裂只需要消除终止或抑制组,来自核苷酸的萤光组比起3'-封锁结束符是一个更有效的策略来为下一个CRT周期恢复核苷酸。
Helicos生物科学是第一个商品化单分子测序仪的团队,HeliScope Quake和他的同事们。
HeliScope用单核分子模板方法,在图一c和图1d中可以看到,和一色CRT方法结合,在图2c中可以看到。