基因组作图ppt课件(1)
20世纪80年代后期,人们开始应用微卫星序列(microsatellite,MS)绘制图谱。1994
年底,美、法完成了以RFLP及微卫星DNA为标志的遗传图谱.图谱包含了
5826位点,覆盖4000cM,分辨率高达0.7cM.1996年法国报道了完全以微卫星
DNA标志构建的遗传连锁图,包含2335位点,分辩率为1.6cM
重复序列较高的地方难度较大。此外有许多序列片段难以定位在确
切的染色体上,成为游离片断;同时又会有许多地方由于没有足够
的覆盖率而形成空缺。这些缺陷最终导致整个基因图会留下大量的
空洞(gap),也影响其准确度
7
.
鸟 枪 法 组 装 序 列
将DNA分子打断为小片段,测定每一段序列,通过查找每8 个 片段序列的重叠部分(需几十个碱基),再组装得到主体序列。
.
鸟枪法是小的原核生物基因组测序的标准方法
9
用鸟枪法获得流感嗜血杆菌的基因组序列
鸟枪法不适用于较大的、复杂的真核生物基因组
➢ 随着片段数的增加,所需的数据分析越来越复杂。n个片 段可能的重叠数为2n2-2n;
.
➢ 分析基因组的重复区域时会发生错误。
串连重复DNA的问题
基因组范围内重复的问题
10
重叠群法
.
遗传作图中DNA标记的发展
遗传标记的发展:
第一代标记 经典的遗传标记(蛋白质和免疫学的标记) 70年代中后期,限制酶片段长度多态性(RFLP)
第二代标记 85年,“小卫星序列"(minisatellite) 89年,“微卫星序列"(microsatellite)
第三代标记 单核苷酸多态性标记(single nucleotide polymorphism ,SNP)
.
以大片断定位的克隆为基础的定向测序战略主要采用克 隆步移法或称重叠群法:
先构建遗传图,再利用几套高度覆盖的大片段基因组文
库(BAC、PAC等)获得精细的物理图,选择合适的
BAC或PAC克隆测序,利用计算机拼装。BAC内的空洞
基本上都可以利用设计引物等手段填补,形成一条完整
的BAC序列。然后由相互关联、部分重叠的BAC克隆连
➢ 典型的形态标记用肉眼即可识别 和观察,广义的形态标记还包括 那些借助简单测试即可识别的性 状,如生理特性、抗病虫性等;
➢ 形态标记简单直观、经济方便, 容易观察记载。
17
.
形态标记的不足
➢ 可以观察到的标记非常有限,难以建立饱和的遗传图谱; ➢ 许多形态标记受环境、生育期等因素的影响; ➢ 复等位基因位点很难全部鉴定、标记出来。
不足之处
➢ 同工酶标记都需要特殊的显色方法和技术; ➢ 某些酶的活性具有发育和组织特异性;
21
➢ 标记的数量还是相对有限。
.
SDS-PAGE separates proteins by MW Animation
22
2.1.4 DNA标记
➢ 基于DNA水平遗传多态性构建的分子标记。
.
DNA分子标记的优点
15
.
形态标记 (morphological markers)
细胞学标记 (cytological markers)
生化标记 (biochemical markers)
分子标记 16
(molecular markers)
.
2.1.1 形态标记
➢ 指能明确显示遗传多态性的外观性状, 如水稻株高,果蝇眼色等;
也俗称“霰弹法”,是随机先将整个基因组打碎成小片段进行测序, 最终利用计算机根据序列之间的重叠关系进行排序和组装,并确定 它们在基因组中的正确位置
“鸟枪法”优点是速度快,简单易行,成本较低,可以在较短的
时间内通过集中机器和人力的方法获得大量的基因片断
但是用它来测序,最终排序结果的拼接组装比较困难,尤其在部分
.
➢ 同一亲本及其子代相同位点上的多态性不变;
➢ 共显性,同一凝胶电泳可显示不同多态性片段;
❖ 实验操作较繁琐,成本较高;探针必须是单拷贝或寡拷贝 的,制备较麻烦;检测中如要利用放射性同位素,易造成 环境污染;检测周期长;
❖ 检测所需样本DNA量大(5~15ug);
❖ 可以用非放射性物质,但杂交信号相对较弱,灵敏度较同
成一个大的重叠群(Contig)。理想状况下,整条染色
体就是由一个完整的重叠群构成。
11
.
利用重克叠隆群步移法法测序,国际上通行的标准要求BAC测序达
到十倍覆盖率,使所测的序列达到99.99%以上的准确度。的工作。
➢ 遗传多态性丰富;
➢ 共显性遗传,信息完整;
➢ 在基因组中大量存在且分布均匀;
➢ 稳定性、重现性好;
➢ 检测手段简单快捷,易于自动化,成本较低。
23
.
DNA标记的种类
➢ 限制性片段长度多态性 (RFLP, restriction fragment length polymorphism);
➢ 简单序列长度多态性 (SSLP, simple sequence length polymorphism);
❖ 微卫星序列 (microsatellite):或称简单序列重复 (simple
sequence repeat, SSR) ,简单串联重复 (simple tandem
repeat, STR)。重复单位较短,常为2, 3或4个核苷酸单位,
重复次数一般10-50次。
33
小卫星DNA
简单序列长度多态性:微卫星序列
此外,费用相对于鸟枪法要稍高一些,完成整个基因组测 序周期也要长些。但是,通过这种方法得到的基因组数据 是最为准确和精细的数据,也是基因组测序的最终目标。 大基因组“完成图”目前大多都是通过这种方法获得的。 基因组“完成图”,即完全覆盖所测物种的基因组、准确 率超过99.99%的全DNA序列图。“完成图”的覆盖率接 近100%,准确率更高,达到99.99%。
.
基因组作图
1
染色体结构与基因
基因组计划的基本目标
.
获得全基因组顺序,在此基础上再对所获得的序列进行解 读。获得基因组顺序的主要方法是进行DNA测序,然后再 将读取的顺序组装。目前的DNA测序每次反应仅能读取不 到1000bp的长度,因此基因组测序的第一步是构建基因组 图,然后将基因组区段分解逐个测序,最后进行组装。
➢ 当前测序方法的局限:<750bp 需将DNA分子打断为小 片段,测出每一段序列,再通过重叠部分拼接成长的序 列。 鸟枪法(shotgun method)。
遗传作图→ 物理作图 → 基因组测序
4
.
以基因组图谱为指导的两种测序方法
➢ 全基因组鸟枪法 (whole-genome shotgun method):首先进 行全基因组鸟枪法测序,再以基因组图谱的分子标记为 起点将鸟枪法DNA片段进行组装。由下而上 (bottom to up) 的测序策略;
➢ 有些物种对染色体变异的耐受性差,难以获得相应的标19记 材料。
.
20
.
2.1.3 生化标记
➢ 是指以基因表达的蛋白质产物为主的一类遗传标记系统。 主要包括贮藏蛋白、同工酶等标记;
➢ 与形态、细胞学标记相比,数量丰富,受环境影响小,能 更好地反映遗传多态性。应用于物种起源和进化研究、种 质鉴定分类、抗病性筛选等。
每个SSR座位 两侧一般是相 对保守的单拷
贝序列
.
SSR的优点
➢ 一般检测到的是单一的复等位基因位点,提供的信息 量高;
26
.
RFLP
➢ 由于限制性内切酶酶切位点或位点间DNA区段发生突变引 起的;
➢ 最早由Bostein 于1980年提出, 是第一种用于 作图研究的分 子标记,第一 代DNA分子标 记。
27
.
同源染色体同一区段DNA 序列的差异, 限制酶识别的碱基顺序有专一性
28
.
29
.
30
RFLP标记的特征
13
.
基因组作图的方法
➢ 遗传作图 (genetic mapping):采用遗传学分析方法将基因 或其他DNA分子标记标定在染色体上。构建的连锁图称 为遗传连锁图谱(genetic linkage map)或遗传图谱 (genetic map)。方法包括杂交实验、家系分析。图距单位为cM;
➢ 物理作图 (physical mapping):采用分子生物学技术直接 将DNA分子标记、基因或克隆标定在基因组实际位置。 构建的位置图称为物理图谱 (physical map)。图距单位: bp、kb、Mb,cR(厘镭,辐射杂种作图)。
–小卫星序列:(Minisatellite DNA)
–微卫星序列:(Microsatellite DNA, MS)
➢ 单核苷酸多态性 (SNP, single nucleotide polymorphism);
➢ RAPD(random amplified polymorphic DNA, 随机扩增多态 性DNA标记 )标记、AFLP(amplified fragment length 24 polymorphism,扩增片段长度多态性)标记等。
➢ 克隆重叠群法 (clone contig method):基因组被打断许多 片段,建立重叠群,对每一片段进行鸟枪法测序。一旦 一个片段的序列测定完成,便可定位在基因组图谱的正 确位置上。由上而下(up to down)的测序策略。
5
.
6
什么是鸟枪法
.
全基因组随机测序战略主要采用鸟枪法(shotgun)。鸟枪法,
位素标记低,且相对价格较高。
31
遗传作图中的第二代DNA标记
.
简单序列长度多态性 SSLPs
发现:
小卫星序列minisatellite (1985年)