当前位置:文档之家› EST-SSSR分子标记的建立

EST-SSSR分子标记的建立

课程名称: 分子育种学 指导老师: 海瑞 成绩: 实验名称: EST-SSR 标记的开发 实验类型: 综合型分工: 奕-EST 获取+结果分析+引物设计 王鹏潮-SSR 筛选+SSR 统计+结果分析一、实验目的和要求1、了解SSR 标记的开发策略;2、明确EST-SSR 标记的特点和建立EST-SSR 标记的原理;3、熟悉EST-SSR 标记的过程,掌握EST-SSR 标记的开发技术。

二、实验容和原理 1、实验容通过从现有的EST 文库中获取序列,再用软件对其进行SSR 查找与引物设计。

2、实验原理 1)微卫星DNA真核基因组中存在着大量的串联重复序列, 按重复单位的大小, 串联重复可分为卫星(重复序列>70bp )、小卫星(6~70bp )和微卫星DNA (1-6bp )。

微卫星(Microsatellite, MS )是指基因组中以少数几个核苷酸(多数为2~4个)为单位多次串联重复组成的长达几十个核苷酸的序列,又称简单序列重复(Simple Sequence Repeats , SSR )或短串联重复(Short Tandem Repeats , STR )、或简单序列长度多态性(Simple Sequence Length Polymorphism ,SSLP )。

重复数目是可变的,重复序列两侧都有物种特异性的保守序列,所以通过设计引物进行PCR 扩增,就可以检测到不同的DNA 区域重复数目的多态性。

2)SSR 标记的开发策略SSR 包括基因组SSR (genomic SSR 或gSSR )和表达区EST-SSR (genic-SSR 或EST-SSR )。

gSSR 是基于基因组序列开发的,开发起来费时费力,而且因为探针的缘故,种类比较局限。

而EST —SSR 则是存在于表达的基因序列的SSR ,不包括含子及非表达的调控区等之中的SSR ,通常三个碱基重复的占多数,与不引起基因翻译过程中移码现象的发生相一致。

建立SSR 标记的前提是必需知道重复序列两列的DNA 序列。

与其他标记相比,SSR 标记具有如下特点: (1)数量较为丰富,覆盖整个染色体组; (2)具有多等位基因特性,信息含量高; (3)以孟德尔方式遗传,呈共显性;(4)易于利用PCR 技术分析,对DNA 数量和纯度要求不高,结果重复性好; (5)每个位点由引物序列决定,便于交换。

近年来,EST-SSR 标记的开发引起关注。

数量迅速增加的ESTs 为开发新的SSR 标记提供了宝贵的资源,各种植物中约有5-10%的EST 含有可用于建立标记的SSR 。

建立EST-SSR 标记要经济得多,而且EST-SSR 标记来源于DNA 的转录区域,比gSSR 标记具有更高的通用性,此外,标记-信息量高。

开发EST-SSR原理基于生物信息学手段的可开发SSR的方法。

在数据库中已存在大量的可免费下载EST序列数据并剔除冗余EST序列,再通过SSR搜索软件获得SSR位点信息,然后根据SSR位点两侧的核酸序列信息的统计与分析,利用软件设计相应的SSR 引物,进而开发SSR标记,最后进行PCR扩增及扩增产物电泳检测。

3)不同的SSR标记开发方法比较传统方法开发SSR:传统的SSR 分子标记开发方法简单、易掌握。

这种方法在许多作物的SSR 标记开发中被广泛应用,现已获得的基因组SSR 标记中,四分之三以上的是利用传统开发方法获得的。

但必须对每个克隆进行筛选鉴定,工作量大,需花费大量人力,财力,而且效率较低,植物中已报道的阳性克隆比率约为2 %~3 % ,成功获得引物的机率则更低。

图1 传统SSR开发方法流程图通过富集策略开发SSR标记:为简化技术环节,提高效率,降低开发成本,通过研究建立了多种采取富积策略的SSR 标记开发方法。

基于RAPD 的开发策略:将RAPD 随机引物与SSR连接,作为PCR扩增引物或者将RAPD扩增产物条带用SSR探针进行Southern杂交,可以有效富集重复序列。

虽然目前尚不清楚RAPD有利于SSR 富集的机理,但这一发现大大激发了人们探求富集SSR方法的兴趣。

PIMA ( PCR Isolation of Microsatellite Arrays)方法:先用RAPD引物从基因组中获得随机扩增片段,扩增片段经载体克隆后,用特异SSR及载体引物对克隆阵列进行PCR检测筛选含SSR克隆,对阳性克隆测序。

以上两种利用RAPD 富集SSR的报道,避免了基因组文库的构建,有利于节省时间和人力、物力,但基于此方法进行大量SSR 分离的成功报道并不多。

4)PCR引物设计原则引物长度:15-30bp,常用为20bp左右。

太短会降低退火温度影响引物与模板配对,从而使非特异性增高;太长则比较浪费,且难以合成。

引物扩增跨度:1kb之是理想的扩增跨度,2kb左右是有效的扩增跨度,而超过3kb 就无法得到有效的扩增. 特定条件下可扩增长至10kb的片段。

引物碱基:G+C含量以40-60%为宜,G+C太少扩增效果不佳,G+C过多易出现非特异条带。

A TGC最好随机分布,避免5个以上的嘌呤或嘧啶核苷酸的成串排列。

避免引物部出现二级结构,避免两条引物间互补,特别是3‘端的互补,否则会形成引物二聚体,产生非特异的扩增条带。

引物3’端的碱基,特别是最末及倒数第二个碱基,应严格要求配对,以避免因末端碱基不配对而导致PCR失败。

引物中有或能加上合适的酶切位点,被扩增的靶序列最好有适宜的酶切位点,这对酶切分析或分子克隆很有好处。

引物5'端对扩增特异性影响不大,可在引物设计时加上限制酶位点、核糖体结合位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等。

通常应在5'端限制酶位点外再加1-2个保护碱基。

引物的特异性:引物应与核酸序列数据库的其它序列无明显同源性所扩增产物本身无稳定的二级结构,以免产生非特异性扩增,影响产量。

引物量:每条引物的浓度0.1~1umol或10-100pmol,以最低引物量产生所需要的结果为好,引物浓度偏高会引起错配和非特异性扩增,且可增加引物之间形成二聚体的机会。

三、主要仪器设备计算机四、操作方法与实验步骤1、EST序列的获取可从数据库中直接下载,主要的数据库有:美国国立生物技术信息中心GenBank/NCBI ( National Center for Biotechnology Information ):;目前有72098808条EST序列,其中植物EST序列24158363条,涉及到895个物种。

其中单子叶植物:7263423条:玉米-2019114;水稻-1333022;小麦-11116126。

欧洲生物信息研究所European Bioinformatics Institute (EBI):/index.html ,包含European Nucleotide Archive;日本DNA数据库DDBJ(DNA Data Bank of Japan):.ddbj.nig.ac.jp/;先以从NCBI下载EST序列为例:首先<EST>下直接填写植物名称后按search,再在<Taxonomy>下搜索栏直接填写植物种属名称后按search,出现以下界面时选EST并点击植物名后,按上述方法下载即可。

2、去冗余(EST序列前处理,在本次实验中由于软件收费略去)采用EST分析软件前处理和剔除冗余EST:直接获取的EST中包含一些低质量片段(<100 bp),少量载体序列及末端存在polyA/T“尾巴”的序列,在开发标记之前应去除这些“噪音”——去冗余。

这些处理可通过一些软件来进行:cross-match(/)或EST-trimmer (.pgrc.ipk-gathersleben.de/misa/download/est-trimmer.pl),去除“尾巴”和屏蔽载体序列。

可用生物信息学软件去冗余:如Cluster W、CD-HIT [/cd-hi/](若只考虑建立标记而不求统计相关参数,也可搜索后聚类,剔除冗余的SSR)。

3、SSR的搜寻可利用以下一些软件在线搜索SSR:(1)RepeatMasker(/cgi-bin/WEBRepeatMasker)(2)SSRIT(/db/searches/ssrtool):①选择搜索参数:最大值;②粘贴序列(<100Kb);③获得结果和统计相关参数。

(3)Sputnik (bri.fr/outils/Pise/spumik.html)也可利用MISA、DNAman、ssrhunter或ssrfinder等进行本地化搜索SSR,注意制定搜索SSR的标准。

4、设计SSR引物利用软件设计相应的SSR引物,常用引物设计软件有primerpremier 5.0和oligo 6.0。

也可以用在线设计软件,如primer3.0 (frodo.wi.mitedu/cgi-bin/primer3/primer3_. Cgi)进行引物设计。

5、建立标记(略去)PCR实验:温度、浓度、[混合模板]扩增多态性及其检测:不同材料、聚丙烯酰胺凝胶电泳、银染五、实验数据记录和处理选取NCBI的EST数据库中小麦Triticum aestivum中的前1000条进行SSRIT分析,后选取5条用primeprime5.0进行引物设计,得到如下结果。

表1 1000条小麦EST中SSR的出现频率重复类型基元种数SSR数目占全部SSR比例(%)出现频率(%)单核苷酸2510.60.5二核苷酸41123.4 1.1三核苷酸182961.7 2.9四核苷酸22 4.30.2总计2647100 4.7表2 1000条小麦EST二核苷酸和三核苷酸重复基元分析重复基元数量发生频率(%)所占比例(%)单核苷酸c/g30.360.0 t20.240.0二核苷酸tc/ga80.872.7 tg10.19.1 at10.19.1 ag 1 0.1 9.1三核苷酸ggc/gcc 6 0.6 20.7 cgg/ccg 4 0.4 13.8 gcg 3 0.3 10.3 tcg/cga 2 0.2 6.9 ggt/acc 2 0.2 6.9 gca 2 0.2 6.9 gag 2 0.2 6.9 ctg 2 0.2 6.9 tcc 1 0.1 3.4 gac 1 0.1 3.4 cac 1 0.1 3.4 ata 1 0.1 3.4 agc 1 0.1 3.4 aag 1 0.1 3.4表3 1000条小麦EST中SSR的重复长度和性质重复基元长度(bp)重复性质变化围平均长度完全重复不完全重复总计二核苷酸14-2414.411011 三核苷酸15-14122.329029 四核苷酸202020 2 合计14-1411847047表4 对小麦EST-SSR设计的引物(其中5对)引物编号重复基元预期产物bp Tm℃GC% 序列(5’→3’)gi|32457 5488 tg(12)343 56.1 50 GGAGTATGTATGTCGAGCCAGT54.2 57.9 CCTCTTGACCTACCCGTTCgi|38374 8333 gcg(5)346 60.4 66.7 TAGAACCACCCGCCCGTC58 57.9 GTGCTGCTGTGCTGATGGAgi|38374 8249 gcc(5)282 58.5 64.7 CTGTCGTGGCGGTCCAA56.4 57.9 CTTCAGCCAGCAGCAAGTCgi|38374 8634 gag(6)276 51.5 50 GATGGGTCCTTGGATTTC49.2 60 CGCCGTGATAAACCCgi|38374 8369 ga(6)185 56.6 39.1 TGAGAAATTCAGGGTAAACAGTG57.2 61.1 CCACCGCCGACTACTGAA六、实验结果与分析从结果中可以得知,小麦EST序列中的SSR种类较为丰富,达到26种之多,主要以三核苷酸重复为主(推测三核苷酸重复类型居多的可能是因为EST编码区序列以三核苷酸重复类型为主,而遗传密码子均为三联体核苷酸类型),其中g/c组合成的SSR所占比例较高,但SSR整体的出现频率并不高,不足5%,平均长度为18bp。

相关主题