当前位置:文档之家› 下一代测序技术与其他技术平台

下一代测序技术与其他技术平台


人类遗传病DNA检测技术的发展趋势
2005 大规模重测序 GWAS鉴定SNP 2010 SNP芯片大 样本量筛查 2015 目标测序、疾 病检测模块 几百美元 对于一种疾病 几十个基因, 几百个位点
几千万美元 3. Gb全基因组
几十万美元 500Kb SNP
一个反应对96个样本中的,6500个区段扩增,检测目标区段多态性。唐氏综合证产 前筛查、耳聋基因筛查、癌症几率报告等等(华大收购了Ion Torrent PGM)
Sanger 测序法 (ABI 3730 XL sequencer)
Illumina 测序仪的结构பைடு நூலகம்基本术语
Flowcell: 流动槽, 盛有磁珠的芯片 Lane: 泳道, 每 一次测序操作需要一周,成本花费10万元 Read: 读长
Illumina HiSeq 系列测序仪
三代测序技术:Pacific Biosciences 单分子测序仪
founded in 2004, 4亿美元融资
ZMW: Zero-mode waveguides
SMRT 测序原理
• 1. 用4种荧光分别标记4种dNTP • 2. 在测序芯片的底部做出许多用与入射光 波长相应的小孔,特定的孔径保证了入射 光在小孔中只以走很短的矩离。只够照到 正好与酶在相互作用的荧光dNTP底物 • 3. 把聚合酶锚定在测序芯片的底部 • 4. 让DNA链与酶结合,进行测序 • 5测序时,荧光dNTP与酶+DNA模板型成 复合物,短暂结合 • 6. 荧光dNTP被激光照射,发出荧光,荧 光被检测到 • 7. 酶反应过程,一方面使链延伸,同时使 dNTP上的荧光基团脱落 • 8. 聚合反应持续进行,测序同时持继进行 • 9. 用摄像机记录这个过程
谢谢!
1. 线性回归模型
候选育种材料的收集(农家) (候选群体 ~10,000)
基因组测序(基因型)
基因组测序(基因型)
鉴定控制优良性状的基因型 (基因组关联分析)
基因-性状连锁图谱
候选材料的育种价 值 (GEBV)评估 对产量、抗性等性 状进行预测
选择育种价值较高的材料 (实验群体 ~100)
周期从7到8年缩短到3到5年
• 基于全基因组测序的方法 (500~1000个体) 初步在一个群体里鉴定所有可能的SNP,~百万个 • 基于SNP芯片杂交的方法 (几万个体,千元以下/个体) 仍属于大规模群体筛选,建立SNP-疾病关联,确定 该群体内准确的SNP分子标记。 • 基于目标测序的方法 (商业化基因型SNP检测试剂盒) 目标基因、分子标记比较明确,个性化医疗 • 基于SNP位点设计引物扩增的方法(荧光和质谱) 用明确的致病基因的SNP标记、分子标记
>read_1 ACGTCAGTACGGATGCTAGTCGGCACCATCATTGTGTC
Reaction: 加入一种颜色标记的碱基 Barcode: 在一条泳道里标记多样本 Base-calling: 识别碱基
Illumina 测序原理
DNA template
Adaptor 1
Adaptor 2
病人DNA样品
已知的所有致病SNP
Douglas Scientific: Lab Automation
8小时
15万样品
Soellex® High Throughput PCR Thermal Cycler
Thermal Cycle 230,400 Data Points in a Single Run
SNP芯片设计和工作原理
正常 癌症
样品制备 荧光标记 杂交
扫描
数据分析
Affymetrix SNP芯片
SNP genotyping using the Sequenom MassARRAY iPLEX platform
抗虫基因型: (AA) ACGTGACGTGTAGGTCACTCTACCGTAGCGTCATGT ACGTGACGTGTAGGTCACTCTACCGTAGCGTCATGT 易感基因型:(aa) ACGTGACGCGTAGGTCACTCTACCGTAGCGTCATGT ACGTGACGCGTAGGTCACTCTACCGTAGCGTCATGT 杂合基因型:(Aa) ACGTGACGTGTAGGTCACTCTACCGTAGCGTCATGT ACGTGACGCGTAGGTCACTCTACCGTAGCGTCATGT (AA) X (aa) F1代: (Aa) x F1 (Aa) F2 代:(AA): (Aa):(aa) = 1:2:1 以T和G作为SNP分子标记筛选带有AA基因型的植株
0 设计大田育种实验方案
一、二、三代测序技术原理介绍
2, 3代一般统称为Next Generation Sequencing (NGS)
测序技术发展里程
第一代测序:Sanger法测序, 1970年,30亿美元测人类基因组(一条1 Kbp DNA序列) 第二代测序:(或新一代 Next Generation,或高通量测序 High-throughput sequencing,或并 行测序Parallel sequencing, 或深度测序Deep sequencing,或边合成边测序 Sequencing by Synthesis, 等很多名称) 1. 454焦磷酸测序 2004 (几万条读长=200~500nt) 2. Solexa测序 2006 (几百万读长=36nt) 3. ABI SOLiD测序 2006 (几百万读长=50nt) 4. Illumina GA II 2007 (几千万条读长=70nt) 5. HeliScope单分子测序 2009 6. ION torrent 测序 2010-2014 (准三代,几十万条读长=500nt) 7. Illumina HiSeq2000测序平台 2010-2013年 (几千万条100-nt短序列) 8. Illumina HiSeq2500, Next 500, MiSeq, X Ten系列,(1000美元一个基因组) 9. Complete genomics, BGI, (华大收购,个性医疗,500美元一个基因组) 第三代测序: (Third Generation or Single Molecule Sequencing,单分子测序) 1. Pacific Biosciences 单分子实时测序平台 2012 (几万条10kb序列=300 Mb) 2. Oxford Nanopore纳米孔测序 2013
SMRT (Single Molecule Real Time) Cell
拍摄萤光变化的电影
图像解码,推测序列SMRT 的构建(环形DNA)1、环形不易断裂,可以周而复始地测序,充分利用PacBio的读长 2、插入序列的正向链和反向链都可以被读到,起到自我校正作用 3、两端的已知接头序列,可以用作计数器,用于计算模板被周而复始 地测了几次
应用PacBio测序补齐人类基因组上的Gap,大多是高 GC含量区和重复序列 2014, Nature
三代与二代区别(4):方便检测可变剪切转录本
二代
无法准确区分每一个isoform 表达量
三代
准确区分每一个Isoform产生的转录本
总结:一、二、三代测序平台比较
X X X ?
其他基因型检测技术平台
LGC KASP genotyping assay
本质就是荧光定量PCR,需要荧光标记,成本较高 1. 在SNP位点设计Allele-specific 引物 CC 纯合基因型 CA 杂合基因型
2. 仅带有C引物的DNA被扩增出来
AA 纯合基因型
3. 仅带有C的DNA被加上荧光标记
KASP的免费软件 SNPviewer
扩增 ACGTGACGTGTAGGTCACTCTACCGTAGCGTCATGT ACGTGACGCGTAGGTCACTCTACCGTAGCGTCATGT 80% 为易感基因型 DNA (aa) 7% 为抗性基因型 DNA (AA) 13% 为杂合基因型 DNA (Aa)
Sequenome genotyping 软件
第二部分:
下一代测序技术与其他技术平台
孟山都现代SNP分子标记辅助的精确耕种
种子(条形码编码)切割机器人 种植带有优良基因型
基因型选种
从种子上取一小块组织
道格拉斯Array Tape利用SNP分子 标记对几万颗种子鉴定基因型
基因组选择(Genomic selection)辅助的精确育种策略
农艺性状优良品种 (训练群体~100) 基因组选择预 测模型的构建
Araya® In-Line Fluorescence Detection System
荧光扫描
大数据分析方法的利器 — 机器学习
机器学习理论主要是设计让计算机可以自动“学习”的算法和模型,从先验 “知识”中获得规律,从而对未知数据进行预测的智能技术。 与统计检验(Model-driven)相比,机器学习(Data-driven)的最大优势是通 过“知识”与“数据”的整合,采用监督式的学习方式对预测模型进行优化。
利用质谱的原理分离SNP,不 需要荧光标记,成本低通量高
maldi tof (飞行时间质谱原理)
利用分子量(MASS)大小不同的核苷酸、氨基酸片段 在电场里飞行的时间(time of flying)不同
数据分析 与数据库比较,预测 氨基酸序列
DNA上样 最多384个样品
运行
iPLEX 工作流程
Allele-specific primer for PCR 引物设计 引物1:TGTAGGTCACTCTACC 引物2:CGTAGGTCACTCTACC
三代与二代区别(1):读长(read length)
读长很长,单条Read读长可以平均达到10kb,二代只有100bp
三代与二代区别(2) :检测甲基化的碱基
A, C, G, T加入的时间间隔不一样,带有甲基化的位点,加入的碱基时间延迟
相关主题