本技术涉及二代测序分析领域的基于二代测序的石蜡切片样本体细胞突变检测方法和装置。
该方法包括:获取新鲜肿瘤冷冻组织样本体细胞突变和肿瘤组织石蜡切片样本体细胞突变最高一致性时的过滤参数作为过滤阈值;检测待测肿瘤组织石蜡切片样本的体细胞突变;过滤与正常样本变异位点集重合的位点;过滤未达到所述过滤阈值的体细胞突变位点;过滤生殖细胞突变和高频突变位点。
本技术以PON、以基于石蜡切片组织特征的特异性训练体细胞突变位点过滤阈值以及以已有数据库过滤生殖细胞突变和高频突变位点作为体细胞突变检测的过滤条件,能够快速剔除大部分由石蜡切片制备造成的假阳性结果,提高检测效率和特异性,快速精准检测石蜡切片体细胞突变。
权利要求书1.基于二代测序的石蜡切片样本体细胞突变检测方法,其特征在于,包括如下步骤:获取正常组织石蜡切片样本的测序结果,将所述测序结果与人类参考基因组比对,所得比对数据构建正常组织石蜡切片样本的正常样本变异位点集;分别获取同一组织来源的新鲜肿瘤冷冻组织样本、肿瘤组织石蜡切片样本和正常组织样本的测序结果,基于测序结果,在不同过滤参数下检测新鲜肿瘤冷冻组织样本的体细胞突变和肿瘤组织石蜡切片样本的体细胞突变;对比所述新鲜肿瘤冷冻组织样本体细胞突变和肿瘤组织石蜡切片样本体细胞突变的一致性,获取最高一致性时的过滤参数作为过滤阈值;分别获取待测肿瘤组织石蜡切片样本及其配对正常组织样本的测序结果,基于测序结果检测待测肿瘤组织石蜡切片样本的体细胞突变,得到原始变异结果;过滤所述原始变异结果中与正常样本变异位点集重合的位点,得到第一体细胞突变结果;过滤所述第一体细胞突变结果中未达到所述过滤阈值的体细胞突变位点,得到第二体细胞突变结果;过滤所述第二体细胞突变结果中生殖细胞突变和高频突变位点,即得待测肿瘤组织石蜡切片样本的体细胞突变结果;所述过滤参数包括体细胞变异位点的测序深度总和、变异等位基因频率、链偏好性、Read 朝向偏好性、测序质量值、胚系突变干扰值、污染物干扰值、碱基质量值中位数、平均比对质量值、片段长度中位数、reads末端距离中位数、假阳性优势对数、覆盖reads总数、位点杂合纯合性优势对数、短片段重复次数、链偏好质量值、聚合酶滑动质量值中的一种或一种以上;针对所述过滤参数设定阈值。
2.根据权利要求1所述的体细胞突变检测方法,其特征在于,所述过滤参数包括变异等位基因频率、链偏好性和Read朝向偏好性中的一种或一种以上。
3.根据权利要求2所述的体细胞突变检测方法,其特征在于,所述链偏好性的计算公式为:链偏好性 = 正向读长深度 / 所有读长深度;所述Read朝向偏好性的计算公式为:其中,SOB表示Read朝向偏好性;#of F1R2alt表示和参考基因组方向互补且携带突变位点的reads总数;#of F2R1alt表示和参考基因组方向相同且携带突变位点的reads总数。
4.根据权利要求1所述的体细胞突变检测方法,其特征在于,根据属性约减法,选择最优三种所述过滤参数组合。
5.根据权利要求1所述的体细胞突变检测方法,其特征在于,采用统计学方法获取所述过滤阈值;所述统计学方法包括Kappa一致性检验、卡方检验、配对t检验和相关系数中的任一种方法。
6.根据权利要求1所述的体细胞突变检测方法,其特征在于,所述配对正常组织样本与待测肿瘤组织石蜡切片样本来源于同一个体;所述配对正常组织样本包括外周血、癌旁组织和新鲜组织中的一种或一种以上。
7.根据权利要求1所述的体细胞突变检测方法,其特征在于,使用任何生殖细胞突变和高频突变的先验数据库过滤所述生殖细胞突变和高频突变位点;所述体细胞突变位点在任一生殖细胞突变和高频突变的先验数据库中,则进行过滤。
8.根据权利要求7所述的体细胞突变检测方法,其特征在于,根据属性约减法,选择生殖细胞突变和高频突变的先验数据库中的任意三种数据库。
9.根据权利要求8所述的体细胞突变检测方法,其特征在于,所述数据库为dbSNP、1000Genomes Project和ExAC。
10.根据权利要求1所述的体细胞突变检测方法,其特征在于,所述正常组织石蜡切片样本的测序结果在与参考基因组比对前,包括质控步骤:所述测序结果去除测序接头序列、低质量序列和N碱基组成的序列,得到过滤数据;对所述过滤数据去接头后的碱基数、碱基质量大于20的百分比、碱基质量大于30的百分比、GC含量、GC-AT分离比、N含量、平均读长长度、读长分布标准差、平均碱基质量和可用数据比例进行筛选,选择符合设定阈值的测序数据进行对比。
11.根据权利要求1所述的体细胞突变检测方法,其特征在于,所述比对数据进行去重合排序处理,并对比对上的数据进行比对率、平均比对质量、插入片段大小、重复片段比例、捕获效率、目标区域测序深度、目标区域覆盖度、大于500X测序深度区域所占比例、大于100X 测序深度区域所占比例和大于10X测序深度区域所占比例筛选,选择符合设定阈值的数据构建正常样本变异位点集。
12.基于二代测序的石蜡切片样本体细胞突变检测装置,其特征在于,包括,原始变异结果提取模块,用于利用待测肿瘤组织石蜡切片样本及其配对正常组织样本的测序结果,基于测序结果检测待测肿瘤组织石蜡切片样本的体细胞突变,提取原始变异结果;第一过滤模块,用于过滤原始变异结果中与正常样本变异位点集重合的位点,得到第一体细胞突变结果;其中,正常样本变异位点集为正常组织石蜡切片样本的测序结果与参考基因组比对而构建;第二过滤模块,用于过滤第一体细胞突变结果中未达到所述过滤阈值的体细胞突变位点,得到第二体细胞突变结果;其中,过滤阈值为新鲜肿瘤冷冻组织样本体细胞突变和肿瘤组织石蜡切片样本体细胞突变最高一致性时的过滤参数;第三过滤模块,用于过滤第二体细胞突变结果中生殖细胞突变和高频突变位点,得到待测肿瘤组织石蜡切片样本的体细胞突变结果。
13.根据权利要求12所述的装置,其特征在于,所述第二过滤模块包括过滤参数单元和过滤阈值单元;所述过滤参数单元,用于基于将同一组织来源的新鲜肿瘤冷冻组织样本、肿瘤组织石蜡切片样本和正常组织样本的测序结果,在不同过滤参数下检测新鲜肿瘤冷冻组织样本的体细胞突变和肿瘤组织石蜡切片样本的体细胞突变;所述过滤阈值单元,用于对比所述过滤参数单元获得的所述新鲜肿瘤冷冻组织样本体细胞突变和肿瘤组织石蜡切片样本体细胞突变的一致性,获取最高一致性时的过滤参数作为过滤阈值。
14.根据权利要求13所述的装置,其特征在于,所述过滤参数单元中还包括过滤参数组合单元,用于将最优的过滤参数组合。
15.根据权利要求13或14所述的装置,其特征在于,所述过滤阈值单元还包括统计单元,用于计算获得的所述新鲜肿瘤冷冻组织样本体细胞突变和肿瘤组织石蜡切片样本体细胞突变最高一致性时的过滤参数以获取所述过滤阈值。
16.根据权利要求12所述的装置,其特征在于,所述第三过滤模块包括先验数据库单元,用于过滤所述生殖细胞突变和高频突变位点。
17.根据权利要求16所述的装置,其特征在于,所述先验数据库单元中还包括先验数据库组合单元,用于将最优的先验数据库组合。
18.根据权利要求12所述的装置,其特征在于,所述第一过滤模块还包括质控单元;所述质控单元包括过滤单元和第一筛选单元;所述过滤单元,用于将正常组织石蜡切片样本的测序结果去除测序接头序列、低质量序列和N碱基组成的序列,得到过滤数据;所述第一筛选单元,用于将所述过滤单元获得的过滤数据进行去接头后的碱基数、碱基质量大于20的百分比、碱基质量大于30的百分比、GC含量、GC-AT分离比、N含量、平均读长长度、读长分布标准差、平均碱基质量和可用数据比例筛选,选择符合设定阈值的测序数据进行对比。
19.根据权利要求12所述的装置,其特征在于,所述第一过滤模块还包括去重合排序处理单元和第二筛选单元;所述去重合排序处理单元,用于将质控单元处理后的数据与参考基因组的比对结果进行去重合排序处理;所述第二筛选单元,用于将所述去重合排序处理单元处理后的比对上的数据进行比对率、平均比对质量、插入片段大小、重复片段比例、捕获效率、目标区域测序深度、目标区域覆盖度、大于500X测序深度区域所占比例、大于100X测序深度区域所占比例和大于10X测序深度区域所占比例筛选,选择符合设定阈值的数据构建正常样本变异位点集。
技术说明书基于二代测序的石蜡切片样本体细胞突变检测方法和装置技术领域本技术涉及二代测序分析领域,具体涉及基于二代测序的石蜡切片样本体细胞突变检测方法和装置。
背景技术随着二代测序(NGS)的快速发展,癌症基因组学正在揭示大多数人类恶性肿瘤中多种致癌基因和抑癌基因中观察到的不同频率的体细胞突变,探讨其在诊断、预后及治疗分层中的潜在价值。
特别是用于病理诊断的福尔马林固定石蜡包埋(FFPE)组织对研究癌症基因组学具有重要价值。
与新鲜冷冻组织样品相比,FFPE样品在癌症基因组学方面具有以下4个优点:1) 随着癌症病例和类型的增加,FFPE组织样本允许回顾性研究;2) FFPE切片显示癌症的各种组织学特征,包括癌前病变,可以评估与组织学改变相关的遗传事件;3)通过激光捕获FFPE 切片靶细胞的微分离(LCM),可以更精确地分析肿瘤的进化过程;4) FFPE切片免疫组化(IHC)有助于通过LCM提取特异性靶细胞,阐明特异性标记阳性细胞的遗传改变。
FFPE DNA的二代测序分析具有很大的发展潜力。
然而目前一个主要的挑战在于FFPE样品一般存在降解严重、化学修饰、核酸和蛋白质的交联以及组织处理和加工的变异性,这些分子变化将会直接影响数据质量,带来困扰,如:1)样本降解导致测序Reads比对质量较低,产生较多的SoftClip reads,产生较多的重复测序片段(Duplicate reads);2)甲醛固定导致核酸随机产生胞嘧啶-胸腺嘧啶(C-T)转化,使得FFPE分离的核酸与下游高通量分子技术不兼容,展现出多个方面的偏好,如PCR 偏好、链偏好、序列偏好、比对偏好等,使FFPE DNA鉴定出的突变结果存在很高假阳性,限制了FFPE样本在二代测序中的应用。
目前针对FFPE样本,多数是在提取、建库方法上有不同的研究和改良,在数据分析阶段还没有形成一套完整的可参考流程,因此迫切需要一套基于二代测序的高准确度石蜡切片组织突变检测方法,以确保后续分析的可靠性。
技术内容因此,本技术解决的技术问题在于克服现有技术中石蜡切片样本用于检测体细胞突变存在很高假阳性,从而提供基于二代测序的石蜡切片样本体细胞突变检测方法和装置。
基于二代测序的石蜡切片样本体细胞突变检测方法,包括如下步骤:获取正常组织石蜡切片样本的测序结果,将所述测序结果与人类参考基因组比对,所得比对数据构建正常组织石蜡切片样本的PON(panel of normal, 正常样本变异位点集);分别获取同一组织来源的新鲜肿瘤冷冻组织样本、肿瘤组织石蜡切片样本和正常组织样本的测序结果,基于测序结果,在不同过滤参数下检测新鲜肿瘤冷冻组织样本的体细胞突变和肿瘤组织石蜡切片样本的体细胞突变;对比所述新鲜肿瘤冷冻组织样本体细胞突变和肿瘤组织石蜡切片样本体细胞突变的一致性,获取最高一致性时的过滤参数作为过滤阈值;分别获取待测肿瘤组织石蜡切片样本及其配对正常组织样本的测序结果,基于测序结果检测待测肿瘤组织石蜡切片样本的体细胞突变,得到原始变异结果;过滤所述原始变异结果中与PON重合的位点,得到第一体细胞突变结果;过滤所述第一体细胞突变结果中未达到所述过滤阈值的体细胞突变位点,得到第二体细胞突变结果;过滤所述第二体细胞突变结果中生殖细胞突变和高频突变位点,即得待测肿瘤组织石蜡切片样本的体细胞突变结果。