用 户 手 册 ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ Ampliseq 外显子数据分析流程该分析流程基于 Ion Torrent 信息平台 Torrent Suite(TS) 和 Ion Reporter(IR)两大系统,对 Ampliseq 外显子数据进行一站式的快速分析,包含数据质控、比对、变异位点检出,变异位点注 释,以及报告生成等重要生物信息学分析步骤。
目录 1. Ion Torrent 信息平台简介 ....................................................................................................................... 1 2. 基于 Torrent Suite 的数据分析流程 ....................................................................................................... 2 2.1 测序质量控制 ..................................................................................................................................... 2 2.2 比对 ..................................................................................................................................................... 3 2.3 扩增子覆盖度分析............................................................................................................................. 5 2.4 变异位点检测 .................................................................................................................................... 6 3. 基于 Ion Reporter 的数据分析流程 ........................................................................................................ 8 3.1 丰富的注释信息 ................................................................................................................................. 8 3.2 强大的分析过滤器 ........................................................................................................................... 10 3.3 生产最终报告 ................................................................................................................................... 11 1. Ion Torrent 信息平台简介 Ion Torrent 测序技术平台,提供的不仅仅是一个测序仪器,而是包含数据分析流程在内的一 整套解决方案。
Torrent Suite(TS)和 Ion Reporter (IR)两大系统完成了测序数据的处理、分析 以及生成报告等整个过程。
TS 系统主要负责测序和数据的常规分析,IR 系统主要完成对数据的生 物学功能注释以及对结果的解读和生成报告。
其数据流及分析流程如图 1 所示,测序过程经过信 号处理(Signal Processing)和碱基读出(Base Calling)两个主要步骤获得序列数据;序列数据在 TS 上可以完成比对(Alignment)和变异读出(Variant Call)等常规操作。
在 TS 上所得的数据可以 1 / 12 用 户 手 册 ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ 直接传递到 IR 系统,由 IR 系统内置的分析模块完成生物学功能注释等重要步骤。
IR 系统是一个 整合生物信息分析系统,内置丰富的 Ampliseq 数据分析流程(Workflow),不仅能够完成单一样 本的生物学功能注释,而且能够完成双样本或三样本的比较分析。
这些分析流程可以自动完成, 给变异位点附加丰富的生物学功能注释,并提供用户友好的图形交互界面让分析人员轻松便捷地 完成数据的解读,生成报告。
注释资源包含基因区域、遗传密码子变化、氨基酸变化、GO 注释、 药物靶点等等(详细列表见附录表 1),可以给分析人员提供充足的生物学信息。
图 1:Ion Torrent 技术平台数据流, Ampliseq 数据分析流程及相关信息处理模块 2. 基于 Torrent Suite 的数据分析流程 2.1 测序质量控制 测序质量将直接影响后续数据分析的结果。
在数据下机之前, TS 系统会按照严格的质控指标, 对数据进行过滤和筛选。
如图 2 所示,经过一系列的过滤程序,最后下机数据( Final Library Reads)可以直接用于后续的分析流程。
下机数据以通用文件格式 BAM 保存, TS 后续的数据分析 将基于 BAM 文件展开。
同时 TS 系统提供文件转换插件(File Exporter),可以方便地自动或手动 将 BAM 文件转换成其它通用格式,如 FASTQ 等。
2 / 12 用 户 手 册 ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ 图 2:测序质控参数 Total address wells:表示芯片上的总微孔数量,此参数为固定值,由芯片类型决定。
Wells with ISP: 表示微孔中成功加载微珠的数量及比例,此参数一般高于 60%。
Live ISP:表示可用的微珠数量及比例,此参数一般高于 90%。
Live Library:表示载有待测模板的微珠数量及比例,此参数一般高于 90%。
Polyclonal: 表示多克隆(一个微珠上多个待测模板)数量及比例,此参数一般低于 50%。
Primer Dimer:表示引物二聚体的微珠数量及比例,此参数一般低于 10%。
Low Quality: 表示低测序质量的微珠数量及比例,此参数一般低于 20%。
2.2 比对 数据通过第一步的质量控制之后,如果提供了参考序列(reference),TS 系统将会自动进行 比对分析。
使用其内置的比对软件 TMAP(Torrent Mapper)将测得的各条序列(reads),定位到 基因组上,得到 reads 在基因组上的位置。