高效快速筛选新发现的微卫星位点的方法-HRM摘要:本文介绍了一种新的识别微卫星位点的方法,微卫星标记是一种功能强大的共显性标记,扩增产物可靠且可以确定已知物种的高度的多态信息含量,但是对于新位点的发现依然是一种费时费力的方法。
相对于大肠杆菌文库分离方法,新一代测序技术(NGS)可以得到更多可用的候选基因。
我们对已知微卫星引物的注释作了系统的论述,并发现无论采用什么分离技术,由于PCR 未充分扩增,基因位点的单态性或多拷贝都会导致一半以上的候选基因丢失。
因此,在分子标记技术上,筛选候选基因依然是一个很关键的步骤。
我们通过重新评估毛细电泳法进行基因分型,发现HRM可以用于基因分型及筛选候选基因,对此列出了具体的流程。
通过该流程,或许我们可以快速地进行新一代标记的检测,并可以把费用降低到传统方法的一半甚至四分之一。
关键词:HRM 微卫星重新分离技术分子标记新一代测序技术群体遗传学引言微卫星也叫简单重复序列(SSRs),是群体遗传学中最强大的共显性标记,具有广泛的应用(e.g., Chambers and MacAvoy 2000; Ellegren 2004; Jarne and Lagoda 1996;MacDonald et al. 2011)。
最近由于新一代测序技术(NGS)的发展正解决SSRs技术中的一个重要的缺陷,不能获得足够的设计引物的数据。
扩增片段多态位点的选择,依然是一件费时费力的工作,这是SSRs发展中的另一个瓶颈。
因此我们引进了HRM用于识别潜在的SSR位点,并且HRM有望加快SSR的发展速度,降低传统方法的费用。
SSRs 一般是以核心序列1-6bp为重复单位首尾串联而成的短的DNA序列(Wan et al. 2004)。
微卫星具有高突变率、易于进行PCR扩增、便于毛细电泳法(CE)的分析以及可以利用许多软件工具进行生物学推论的诸多优点,使其在群体遗传学方面得到广泛应用。
传统的SSR位点的重新分离,是借助于丰富的基因文库(Glenn and Schable 2005; Zane et al. 2002),但是该法对于SSR位点不多的物种则不能检测到足够的位点进行分析(Arthofer et al. 2007; Megle´cz et al. 2004)。
由于NGS的不断改进,尤其是罗氏454 FLX 钛化学( Titanium XL ?试剂盒可以使其被更广泛的应用)能够识别更多的片段,NGS如今已逐渐取代克隆文库(Castoe et al. 2010; Santana et al. 2009; Vanpe´ et al. 2009)。
最重要的一点是NGS建立了无可比拟的信息含量,而在大部分文献中大肠杆菌文库的克隆序列却低于1000个(参考本文文献评论),NGS可以产生成千上万的序列,其中SSR位点达好几千。
这些重复区域可以用来设计引物,也可以用软件包进行分析了(Kofler et al. 2007; Megle´cz et al.2009)。
借助于传统的和是基于NGS的分离技术,就可以对扩增的新位点、基因组中单拷贝位点及丰富的多态性进行检测。
筛选步骤通常包括个体序列的扩增,确定扩增片段质量的凝胶电泳和评定等位基因多样性的毛细管电泳。
高分辨率熔解曲线分析技术(H(Graham 2005; Wittwer et al. 2003; Zhou et al. 2004,2005)RM)是一种用于PCR产物分析的均一性好,真正的闭管操作技术。
首先是添加荧光饱和染料进行PCR扩增,然后是高精度的熔解,在这个过程中随着荧光的减少,可以监测到DNA双链向单链的转变。
这种变化是随着DNA片段长度和序列变化而产生的,并由荧光衍生物形成的曲线的峰值反映,峰值是HRM仪器通过感应解链过程引起的温度(dF/dT) 的的变化而出现的(Tindall et al.2009; Wu et al. 2009)。
仅仅含有一种类型的DNA序列的PCR反应(如二倍体的纯合子模板)只产生一个峰的dF/dT曲线。
杂合子模板(如有两个不同等位基因的模板)会产生不同的纯合子(A1A1, A2A2) 和杂合子 (A1A2)。
由于纯合子链的不完全结合,熔解温度比杂合子低的多,结果在dF/dT曲线的峰值出现的较早(Mader et al.2008)。
两种均聚物的不同的序列通常不能形成两个可以明显区分的峰,如杂合子模板除形成一个与杂聚体相关的曲线外,一般还形成一个与均聚物相关的一个峰值的dF/dT曲线 (Mader et al. 2008)。
多拷贝位点或者无特异性的共扩增产物将会引起更复杂的杂聚体形状和其它的dF/ dT峰值。
与之相反,任何峰值的缺失表明扩增过程中没有进行充分的扩增。
HRM除了应用于临床上进行突变扫描,还可以用于数量遗传学的基因分型(Smith et al. 2010) 及识别亲缘关系相近的植物突变体的不同(Mackay et al. 2008; Mader et al. 2010)。
Mader等人(2008)阐述了HRM在SSR分析中应用的理论依据以及与毛细管电泳相比的缺陷。
也就是说,HRM只能完全分析有几个等位基因的低复杂性的SSRs,对未知PCR产物需要与标准基因型比对,这使分析程序变得复杂费力。
因此,在群体遗传学中,我们或许不能用HRM代替CE对高度复杂的SSRs位点进行基因分型。
但是,在对SSR设计适当的引物进行识别及初步测序后,HRM 可以简化筛选程序。
如下:(1)我们通过对比传统和基于NGS对SSR进行分离而引起的候选基因的丢失,对已发表的SSR引物注释进行了系统的分析,我们发现在标记测试中,对于用于筛选的引物,对其选择的严格程度对位点的质量几乎没有影响,即尽管对NGS数据进行了十分严格的选择,但对引物的筛选依然很重要。
(2)我们用HRM重新分析了已分型的14种SSR标记物,并与CE的分析结果进行了比较,表明HRM在筛选过程中的好处。
(3)用192个个体的扩增试验的20个等位基因来验证HRM在基因型研究框架上的概念,(4)最后,我们拟定了HRM在进行快捷有效地筛选高质量的SSR位点的使用流程。
材料和方法一个包含SSR位点的序列转变成功能性的基因标记物通常有几个步骤组成,这些步骤可能并且通常会导致候选基因的丢失。
尽管这些丢失无论从时间还是金钱上来说都是很昂贵的,但一直没有详细的报道。
我们通过对2008年发表在分子生态资源上的所有引物的进行系统的分析,评估了常规的SSR标记的成功率,单独发表了最后一卷的引物分析。
综述包括了可以提供所有最初检测的引物对的数量及多态位点的总量的所有文章(论文数量=238;见表 S1, S2)。
提供足够数据进行推断的文章的一部分:•已知序列文库克隆的数量 (n = 181)•含有SSR位点文库克隆的比率(n = 133)•选为引物测验克隆的SSR的比例 (n = 133)•由于PCR未完全扩增造成的基因的丢失(n = 72).为了比较常规的SSR与基于新一代测序技术上的SSR的结果,我们利用发表在2011年7月10号之前借助于NGS的文章做了一个相似的评论,这些文章提供了引物对的数量及多个位点(见表S1, S3)。
常规PCR和毛细管电泳我们在实验室中用以前发表的蚂蚁(膜翅目)的SSR设置了两组对照试验,以比较传统的SSR基因分型效果与HRM的分析效果,这些蚂蚁属工匠收获蚁(Arthoferet al. 2005)和长白山红蚂蚁(Steiner et al. 2007),其分类为石蛃属(Microcoryphia),所用基因是两个新发现的还未发表的SSR位点。
用于最初的基因分型的蚂蚁的DNA于-20℃保存备用,有足够的用于HRM反应所需的提取物。
用下列引物对M. Pallida位点进行常规的扩增:Mp1-61F(CACGACGTTGTAAAACGAC-TAGCAGAGGGTGGAGTGCTTGG)Mp1-61R (TTCACGCTAAAAAGCACCGCC)Mp1-64F (CACGACGTTGTAAAACGAC-CACTCTGTACACGGAAAATTCG)Mp1-64R (GCTGGTGTCCTTTGACCTTC)以10:1比例标记M13引物,然后用该引物追踪19 Dream Taq chemistry (Fermentas)的上游引物。
PCR反应:94℃预变性5 min;94℃变性30s,60℃退火45s 以及72℃延伸60s 共35个循环;最后68℃延伸20 min。
PCR 产物用琼脂糖凝胶电泳检测,通过与0.25 lg试剂盒的500bp的带型相比较,然后对扩增产物的浓度进行分类,100bp+梯度(-,无条带;+,条带比梯度的弱;++,条带与梯度相同或强与梯度)。
商业供应商完成毛细管电泳分析,通过PeakScanner软件(Applied Biosystems)可以把电子影像分析图可视化并且可以对其评分。
高分辨率熔解曲线分析随机挑选12个经毛细管电泳分型的工匠收获蚁和长白山红蚂蚁个体,每种各6个个体,进行HRM分析。
我们选择了代表下列扩增模式的14个SSR位点:PCR扩增失败、单态性位点、PCR产物在凝胶电泳图像上出现条带丢失或多条带的位点及多拷贝位点(见表1)。
用1× Type-it HRM Mastermix (Qiagen)的Rotorgene Q (Qiagen)PCR系统进行扩增和HEM分析,10ul反应体系中0.2 um 特异性SSR引物和0.8 ulDNA模板(ca.10ng/ul)。
循环条件:95℃预变性3 min;95℃变性10s,55℃退火15s 以及72℃延伸20s 共70个循环;最后68℃延伸20 min。
每个延伸阶段末都需要进行荧光标记。
为确保扩增片段的均匀复性需要保持95℃ 1 min,40℃1 min的2个循环。
高分辨率熔解曲线分析程序:65℃保持1 min,以0.1℃的速率从65℃连续升温至90℃,每步保持2 s后进行荧光收集。
用Rotorgene software(version 1.7)进行比较定量及熔解曲线的分析。
用以下三个参数衡量每一个标记分析结果:(1)每个个体的溶解曲线派生图峰的数目,dF/dT阈值可以通过人工进行调节,以遮掩杂波(Fig. 1)。
(2)每个提供参数的峰的解链温度(1);用于计算相同位点的特异性引物解链温度范围的所有温度值。
(3)所有个体的比较定量分析;我们选择有大量PCR扩增物的个体作为校准复制,该值定为1,并计算了所有用相同位点的特异性引物进行扩增的个体的平均值和标准差。
在基因分型研究中检验HRM的概念为了检测我们提出的HRM在较大研究中筛选基因位点的应用,我们尝试分析20个跨物种的位点,这些位点来自于亲缘关系较近的Tetramorium sp. E 、 T. tsushimae (Steiner et al. 2007)和T. alpestre (Steiner et al. 2010)。