全基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。
基于全基因组重测序技术,人们可以快速进行资源普查筛选,寻找到大量遗传变异,实现遗传进化分析及重要性状候选基因的预测。
随着测序成本降低和拥有参考基因组序列物种增多,全基因组重测序成为动植物育种和群体进化研究迅速有效的方法。
简化基因组测序技术是对与限制性核酸内切酶识别位点相关的DNA进行高通量测序。
RAD-seq(Restriction-site Associated DNA Sequence)和GBS(Genotyping-by-Sequencing)技术是目前应用最为广泛的简化基因组技术,可大幅降低基因组的复杂度,操作简便,同时不受参考基因组的限制,可快速鉴定出高密度的SNP位点,从而实现遗传进化分析及重要性状候选基因的预测。
简化基因组技术尤其适合于大样本量的研究,可以为利用全基因组重测序技术做深度信息挖掘奠定坚实的基础。
全基因组重测序和简化基因组测序技术可广泛应用于变异检测、遗传图谱构建、功能基因挖掘、群体进化等研究,具有重大的科研和产业价值。
产品脉络图动植物重测序建库测序单个性状家系群体自然群体SNP/InDel/SV/CNV/转座子基因组DNA有效SNP性状定位群体进化群体进化(基于简化基因组测序) 群体进化(基于全基因组重测序) 变异检测(基于简化基因组测序)SNP检测/SSR检测遗传图谱全基因组关联分析(GWAS)功能基因挖掘变异检测(基于全基因组重测序) QTL定位BSA性状定位多个性状动植物重测序动植物重测序概述SNP检测、注释及统计基因组DNA350 bp小片段文库HiSeq PE150测序数据质控与参考基因组比对利用全基因组重测序技术对某一物种个体或群体的基因组进行测序及差异分析,可获得SNP、InDel、SV、CNV、PAV、转座子等大量的遗传多态性信息,建立遗传多态性数据库,为后续揭示进化关系、功能基因挖掘等奠定基础。
基于全基因组重测序技术进行变异检测,可在全基因组范围内精确检测多种变异,与传统的分子标记和芯片相比,具有周期短、密度高、检测全面、性价比高等技术优势。
诺禾致源使用的检测软件及参数为国际高影响因子文章通用标准,对获得的变异进行全方位评估以确保变异准确、验证率高。
变异检测(基于全基因组重测序)技术路线技术参数DNA样品量: ≥3 μg测序策略:每个个体测序深度10-30X,推荐深度SNP、InDel(≥10X),SV(≥20X),CNV(≥30X)转座子(≥20X)。
项目周期:SNP检测周期为30天;全部变异检测周期为40天,个性化分析时间需根据项目实际情况进行评估。
变异检测变异分析InDel检测、注释及统计SV检测、注释及统计CNV检测、注释及统计转座子检测、注释及统计该研究对43个牛关键个体(代表Fleckvieh种群68%多态性)进行二代测序,测序深度为4.17-24.98X,平均深度7.46X。
与参考基因组比对,检测出1700万个多态性位点,91,733个变异在18,444个基因编码区中,且46%为非同义突变。
非同义突变中,575个变异可能与转录提前终止相关,3个变异出现在OMIA数据库中并与特定表型相关。
结果表明,通过对能代表种群主要多态性的关键个体进行低、中深度测序,能够高效、准确地获得该物种大量多态性信息。
案例二 牛种群关键个体中低深度测序评估基因组多态性[2]图1 Red-1水稻基因组的变异特征图3 变异注释[1] Cheng Z, Lin J, Lin T, et al . Genome-wide analysis of radiation-induced mutations in rice (Oryza sativa Molecular BioSystems, 2014, 10(4): 795-805.[2] Jansen S, Aigner B, Pausch H, et al . Assessment of the genomic variation in a cattle population by re-sequencing of key animals at low to medium coverage [J]. BMC genomics, 2013, 14(1): 446.图2 SNPs、Indels 和SVs三种变异类型相关基因的WEGO聚类限制性内切酶酶切HiSeq PE150测序数据质控与参考基因组比对Tag聚类、局部组装SNP检测及统计参考基因组已知参考基因组未知利用RAD-seq或GBS技术对某一物种个体或群体的基因组进行测序及差异分析,获得SNP遗传多态性信息,开发分子标记,建立遗传多态性数据库,为分子遗传育种研究、揭示进化关系、功能基因挖掘等奠定基础。
简化基因组技术不受参考基因组限制,基于SNPs的分子标记技术性价比高、稳定性好,在基因组中分布广泛,特别适合大样本量的分析。
诺禾致源具有稳定的简化基因组实验和分析流程,以及严格的质量控制标准,检测的变异准确性好、验证率高。
变异检测(基于简化基因组测序)技术路线技术参数基因组DNARAD文库构建GBS文库构建变异分析SNP检测、注释及统计变异分析InDel检测、注释及统计简化基因组技术RAD-seq GBSDNA样品量建库测序深度参考基因组周期≥3 μg EcoR I酶切+随机打断组装样本≥5X,比对样本≥1X ≥2 μgMse I、EcoR I、Nla III、Hae III等单酶或组合酶切Tag数≥10万,平均8X/Tag有无参考基因组均可标准分析为40天,个性化分析需根据项目实际情况进行评估变异检测图1 301株精选大豆品系的GBS分型结果案例二 GBS技术对大豆育种群体进行基因分型和基因组预测[2]随着基因分型技术的进步,如GBS技术,使分子遗传育种的周期和费用大幅下降。
该研究评估了GBS技术在大豆育种中的应用前景,结果表明GBS技术在大豆育种选择中具有重要潜力(图1)。
参考文献[1] Bus A, Hecht J, Huettel B, et al. High-throughput polymorphism detection and genotyping in Brassica napus using next- generation RAD sequencing [J]. BMC genomics, 2012, 13(1): 281.[2] Jarquín D, Kocak K, Posadas L, et al. Genotyping by sequencing for genomic prediction in a soybean breeding population [J]. BMC Genomics, 2014, 15:740.基因组DNAHiSeq PE150测序与参考基因组比对SNP 频率差异分析目标性状相关区域定位候选基因功能注释350 bp小片段文库数据质控SNP检测及注释针对研究的目标性状,选择表型极端差异的亲本构建家系。
利用混池分组分析法(Bulk Segregant Analysis, BSA),对该家系目标性状表型极端的子代分别混合成的两个样本池进行测序,同时对亲本进行测序,检测与性状相关联的位点并注释,研究基因控制目标性状的机制。
诺禾致源已完成多种动植物BSA性状定位项目,具有丰富的项目经验。
BSA性状定位技术路线技术参数DNA样品量:≥3 μg测序策略:亲本:10X/个 子代:20X/池项目周期:标准分析时间40天,个性化分析需根据项目实际情况进行评估适用范围: 1) 单倍体、二倍体或多倍体物种(有参考基因组序列) 2) 家系群体(F 2、RILs、DH等家系群体)BSA 性状定位本研究采用BSA混样策略,对10株极端性状的样品(F 2子代群体)混合的DNA池,及其亲本进行基因组重测序,通过全基因组扫描SNP,分析频率差异,检测F 2群体早花性状的QTL,找到了一个位于早花QTL 群体,SSR标记构建的遗传图谱进行QTL定位。
两种策略结合,将Ef1.1案例二 QTL-seq定位黄瓜早花重要农艺性状[2]图1 水稻耐盐性突变基因的鉴定图2 黄瓜早花性状在亲本和F 1代的表现及子代极端池SNP-index差异参考文献[1] Takagi H, Tamiru M, Abe A, et al . MutMap accelerates breeding of a salt-tolerant rice cultivar [J]. Nature biotechnology, 2015.[2] Lu H, Lin T, Klein J, et al . QTL-seq identifies an early flowering QTL located near Flowering Locus T in cucumber [J Theoretical and applied genetics, 2014, 127(7): 1491-1499.]350 bp小片段文库功能基因挖掘是对地方驯化品种中不同品种或品系及其野生型,采用对DNA样品混池后建库,或者对所有单个个体DNA样品进行建库的方法,通过全基因组重测序,运用生物信息学方法全基因组范围内扫描变异位点,检测驯化性状相关的基因区域及其功能基因。
诺禾致源拥有资深的信息分析团队,项目经验丰富,功能基因挖掘为我公司首推产品。
功能基因挖掘技术路线基因组DNADNA样品混池DNA样品不混池HiSeq PE150测序数据质控与参考基因组比对SNP检测及注释选择消除分析驯化性状相关区域定位候选基因功能注释技术参数建库方式适用范围周期建库策略多个个体DNA混池测序单个个体建库自然群体DNA样品量≥3 μg DNA池样本数目≥20个/池具有性状差异的有参个体每个群体≥8个个体60天20X/池测序策略5X/个功能基因挖掘图1 候选驯化区域的选择性清除分析案例二 基于全基因组重测序探究狗对淀粉类食物的适应性的关键基因[2]狗被认为是狼驯化的产物,两者在行为和形态上存在极大差异。
研究者应用二代测序技术,对分布于世界各地的7个品种的狼(12只)和14个品种的狗(60只)采用混合测序(Pooling)方式进行了全基因组重测序,共混合6个池,平均每个池测序6X。
通过选择消除分析方法,挖掘到狗驯化过程中受到人工选择,导致现代狗行为和形态与狼存在差异图2 37个候选驯化区域的选择性清除分析[1] Li , Tian , Yeung , et al. Whole-genome sequencing of Berkshire (European native pig) provides insights into its origin and domestication [J]. Nature Scientifc Reports, 2014, 4(4).[2] Axelsson E, Ratnakumar A, Arendt M L, et al. The genomic signature of dog domestication reveals adaptation to a starch-rich diet [J]. Nature, 2013, 495(7441): 360-364.基于全基因组重测序技术对已有参考基因组序列的物种进行个体或群体的全基因组测序,利用高性能计算平台和生物信息学方法,检测单核苷酸多态性位点(SNP),并计算多态性标记间的遗传连锁距离,绘制高密度的遗传图谱。