当前位置:文档之家› 基因组测序基本原理

基因组测序基本原理


SHEAR SIZE SELECT
e.g., 10Kbp ± 8% std.dev.
End Reads (Mates)
550bp
Primer SEQUENCE
LIGATE & CLONE
Vector
重叠群Contigs
重叠群是指一组相互重叠的染色体DNA序列
如何建立重叠群基因克隆?
For sequencing one wants to create “minimum tiling path”
• 荧光标记
– 化学合成时带有荧光素标记的ddNTPs被掺入到反应中。 – 每一种ddNTP都带有自身特定的荧光波长以便于观测
测序结果分析
目前一般采用凝胶电泳法分析-能够比较好的将每 一条dNTP产生的DNA条带分离开。
DNA测序胶: 老方法
在反应中加入不同的ddNTP得到结果
利用电泳或者放射自显影的 方法来分析DNA序列
带有同位素标记的引物或者ddNTP被掺入到反应 中,以便于观测
自动测序仪
输出
DNA测序的实例样本
• 一个带有28个DNA样品的胶图: 绿带:碱基A,, 蓝带 C, 黄带G,红带 T.
• 越小的片段跑得越快
自动测序仪
/sci/techresources/Human_Genome/publicat/hgn/v10n3/images/megabaces.jpg
基因组测序
生物信息系列讲座之二
大纲
I. 核酸DNA的发现以及测序历史简介 II. 双脱氧化(Sanger dideoxy method)测序 III.大片段的DNA测序与基因组测序的大发展 VI.人类基因组 V. 1000美元个体化基因组测序计划(The “$1,000 dollar genome)
重复序列的屏蔽软件
• CENSOR是一个通过参考序列筛选查询序列中 的重复序列并屏蔽同源重复序列的软件工具, 其能够将所有找到的重复生成报告以及分类
CENSOR也可提供离线软件包
Repeat masker
• RepeatMasker通过已知数据库中的重复元素筛 选FASTA格式的查询序列,并返回一个屏蔽之 后的可以用于准备数据库检索查询序列的DNA 序列。
– Contig of smallest number of inserts that covers a region of the chromosome
基因组genomic DNA 重叠群contig 最小路径minimum tiling path
Page 30
限制性酶切产生不同的重叠群Contigs
I
a b c
excision
II a I c a II b c b b d c III d III
a b
c
rearrangement
I a b II c d III e f IV
I a
a d
III e b
II c f
IV
48
人类基因组计划
• 人类基因组计划 (英语:Human Genome Project, HGP)是 一项规模宏大,跨国跨学科的科学探索工程。其宗旨在于 测定组成人类染色体(指单倍体)中所包含的30亿个碱基 对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨 识其载有的基因及其序列,达到破译人类遗传信息的最终 目的。
Repeat masker的离线软件包
两种屏蔽方法的差别
• Repeatmasker用法类似于CENSOR,但这两个工 具各自有自身的优点,在于他们的数据库选取 中有差异,如果要确保数据更加可信。所以同 时用两个工具或者与与其他类似的工具组合使 用。
一些错配的重复序列
collapsed tandem
测序的趋势
相对而言一般很少实验室会自己做测序,一则自身测序费用比较高,而且荧光试剂容 易粹灭,同时也比较消耗时间,另外可能出现一些其它问题引起结果不成功。所以大 部分的测序都是送到相关的测序中心或者公司完成:
--下面这个序列就是一个自动测序仪记录的一段DNA片段
Part II. 大片段DNA测序与基因组测序的大发展
基因组de novo测序
• 基因组de novo测序也叫做基因组从头测序,是指不依赖于 任何已知基因组序列信息对某个物种的基因组进行测序, 然后应用生物信息学手段对测序序列进行拼接和组装,最 终获得该物种基因组序列图谱。
De novo基因原理浅解
• 假设有原始序列:I did not know what is written in this paper. 那么通过de novo分段重复测序得到了3次不同的结果。 • 测序结果1:id idn otkn owwh ati swr itteni nthisp aper • 测序结果2: idid notkn owwha tiswrrit enin th isp ap er • 测序结果3: i di dno tkno ww hati swri tteni nth ispap er
质粒(2-6 kb)
Page 22
大片段载体
Lambda phage – 插入大小: 20–30 kb
Cosmids
– 插入大小: 35–45 kb BACs and PACs (bacterial and P1 artificial chromosomes (Viral) respectively) – 插入大小: 100–300 kb YACs (yeast artificial chromosomes)
• 将3次重叠(overlap)部分进行拼接组成contig(重叠群) idn otkn owwh ididnotknowwha (Contig) idid notkn owwha dno tkno ww
De novo测序原理
mapping测序
• 通过现有的已知同源主链序列,将同源测序片段组装拼装, 建立新序列。该序列与的主链类似,但不一定相同。
乳腺癌患者全基因组测序
• 2012年欧洲内科肿瘤学会(ESMO)研究者首次完成了对 个体的乳腺癌患者全基因组测序以期制定个体化治疗的大 型临床试验。 • 截至2012年9月23日,共有 402名乳腺癌患者已经完成了这 项检测,还有26名患者分析正在进行中。276名患者得到 了基因组检测结果,其中248例进行了完整的全基因组分 析。 André博士说,在172例患者中发现了一个能作为抗 肿瘤药物靶点的基因组改变。有趣的是,20%的患者表现 出一个罕见和意料之外的基因组改变,这就更加突显了全 基因组测序的重要性。
鸟枪法测序步骤
• 第一,建立高度隆片段 的碱基总数应达到基因组5倍以上。 • 第二,高效、大规模的末端测序。 • 第三,序列集合。 • 第四,填补缺口。
鸟枪法测序简要
鸟枪法测序技术
DNA target sample
– 大规模测序通用质粒 – 对插入片段大小比较合适,而且容易使用 – 与其它正常质粒一样能够扩增和分离
Page 25
全基因组鸟枪法测序
• 但是片段比较大时,如在基因组测序时,仅仅由Sanger方 法并不合适,因此Shotgun测序,将基因大片段打碎后测 序。鸟枪法战略(Shotgun Strategy)又称随机测序战略, 是由美国塞莱拉遗传公司创始人克雷格•文特尔发明,主 要针对大片段的全长测序。因为整个基因组太长而每次只 能测得一个500的小片断(read)。
个体化基因组测序计划
• 已有的研究表明,基因或基因组变异是肿瘤发生的根本原 因,利用单细胞全基因组测序技术,可以对获取的肿瘤细 胞进行更为精确和深入的分析,了解癌细胞的基因如何突 变,以及肿瘤的来源、属于哪种基因型等,为早期检测和 诊断肿瘤和肿瘤的个体化治疗提供指导。 • 而基因分析是个体化医疗的前提,因此个体化的基因测序 技术的发展能够驱动着个体化医疗的进程。
B.
C.
Sanger 双脱氧测序原理
3’
Single stranded DNA
3’
5’
5’
a) 常规的PCR,粘附(Anneal)
Sanger 双脱氧测序原理
5’
b) 在延伸的时候将 DNA聚合酶与加入 正常的dNTP,同时 掺入少量的双脱氧 的ddNTP
DNA聚合酶 延伸方向
Hale Waihona Puke 3’Sanger 双脱氧测序原理
3’ T 3’ ddA ddA ddA ddA T T T 5’
5’
以ddATP为例,可以 看到在反应中带有T 的模板被掺入的互补 的ddATP随机停止。 因为ddATP不能够再 使其主链延伸。
如何读取这些DNA片段?
• 同位素标记
– 同位素标记的引物 (如 32P) – 同位素标记的dNTPs (如35S 或者 32P)
人类基因组数据库
/
http://hgpd.lifesciencedb.jp/cgi/
/index.html
/projects/genome/guide/human/
测序实验室
组装缺口
物理缺口
测序缺口
测序缺口- 我们如果已经知道重叠群的顺序和方向,那么 可以通过跨越式测序得到缺口的序列信息。 物理缺口- 没有重叠群覆盖,同时也没有DNA测序结果
39
重复序列干扰鸟枪法测序拼接
重复序列REPEATS
41
重复序列
• 真核生物染色体基因组中重复出现的核苷酸序列。这些序 列一般不编码多肽,在基因组内可成簇排布,也可散布于 基因组。
On WebCT -- “The $1000 genome” -- review of new sequencing techniques by George Church
Part I.核酸测序原理
核酸发现与测序简史
DNA测序的简史
相关主题