当前位置:文档之家› 全基因组重测序分析

全基因组重测序分析

全基因组重测序分析主要包括样品准备和测序、数据比对、多态性分析等步骤。

1)准备样品材料和测序。

根据研究目的确定是单个个体测序,还是多个个体或群体测序,估计所需的测序深度,确定测序读长和文库大小,选择合适的测序平台。

具体所需测序深度取决于测序错误率,参考基因组组装质量,物种的连锁不平衡程度以及研究目的。

一般来说,如果主要是研究个体或群体单个位点核苷酸差异(SNP),每个样品的测序深度通常为2-6倍;如果是检测大片段的DNA序列差异一般需要20?30倍的基因组覆盖深度;如果是用于全基因组关联分析基因分型,所需的覆盖深度可以降到0.5倍CHuang et al 2010)。

2)数据读段比对。

首先检测测序数据的质量,根据质量确定是否要对数据进行质量控制和读段末端截短等比对预处理措施。

然后将数据比对到所研究物种的参考基因组上或其近缘物种的参考基因组上。

鉴于传统的基于局部比对算法的工具无法快速准确的比对短片段序列,生物信息家们发了一系列基于二代测序数据的短序列比对工具。

根据算法的不同,这些工具主要分为两类,一类基于空位种子索引法
3) DNA序列多态性分析:DNA序列多态性分析是重测序分析的基础,主要包括识别单核苷酸多态性(SNP),短片段的插入和删除(InDel),结构变异(StructuralVariation, SV, 一般定义为大于50bp的序列变异),拷贝数变异(Copy NumberVariation,CNV)等。

广义上,拷贝数变异也可以看做是一种结构变异。

相关主题