当前位置:文档之家› 转录组分析_R

转录组分析_R


• 基因功能注释 • 基因结构分析 • 鉴定出大量新转录本 • 可变剪接鉴定 • 基因融合鉴定
Genome Res 2010
无参考基因组生物信息分析
• Unigene功能注释 • Unigene的GO分类 • Unigene代谢通路分析 • 预测编码蛋白框(CDS) • Unigene表达差异分析 • Unigene在样品间的差异GO分类和Pathway
有参考基因组序列生物信息分析
• 基因结构优化 • 鉴定基因可变剪接 • 预测新转录本 • SNP 分析 • 基因融合鉴定
有参考基因组序列信息分析流程
Reads 在基因组上的分布
基因结构优化
通过转录组测序鉴定出酵母3’ 和5’ UTR区域 (Nagalakshmi, U. et al.,2008)
富集性分析
De novo reads组装流程
Unigene GO 分类
Unigene COG 功能分类
基因表达差异分析
N1:total tag Number in sample A N2:total tag Number in sample B X :Gene expression level in sample A y :Gene expression level in sample B Reference: Audic S. et al. The significance of
3’-
…-5’
5’-
GTATTTTC GGC AC AG
A
G
A
C
T C
T TG
Cycle 1:按顺序加入反应试剂
合成第一个碱基
清除未反应的碱基和试剂
激发碱基荧光并收集荧光信号
去除阻断基团和荧光基团
Cycle 2-n:
重复前面的步骤
Cluster station
• 剩下的复制链其一端“固定”在芯片上,另
Genomic intergenic region
SNP分析
N Eng J Med 2009
Deep RNA sequencing at single base-pair resolution reveals high complexity of the rice transcriptome
Rice Transcriptome
基因组表达
测序数据分析
• 1991年Adams开创了EST测序,对每个转录本测定 400-据已经成为数量最多, 涉及物种最广的转录组数据。NCBI设立了专门的数 据库dbEST来存放这些数据。
• 1995年Velculescu建立了短标签来标识法SAGE测序方 法,利用转录本3’端第一个CATG位点下游14p长的短 标签来标识相应的转录本。SAGE方法相比EST测序通量大大提高。 但是由于SAGE标签仅14bp,很难唯一注释到相应转 录本,大量实验得到的SAGE标签无法定位到基因。
mRNA反转录
• 纯化过的mRNA样品加 入1 µl的fragment buffer 70℃作用1.5min。
• 加入1µl的stop buffer终止 反应。
• 入沉淀剂(NaAc 糖原 无水乙醇)沉淀酶切产 物。
• 末端修复 • cDNA 3′末端加A • Adapter连接
不同方法比较
Total RNA样品检测
Agilent 2100 检测
• OD260/280:1.8~2.2 • RNA 28S:18S ≥ 1.0; RImRNA的分离

mRNA的打断

cDNA的合成
末端修复

3’端↓加A

加接头

胶回收
PCR

PCR胶回收
真核mRNA的纯化
Material
callus root at seedling stage(14d) shoot at seedling stage(14d) flag leaves(2 stages) panicle(3 stages)
Methods
RNASeq(paired-end & single end) DGE small RNA(18-30 nt)
• mRNA的纯化主要通过磁 珠吸附原理从而分离纯化
• Oligo(dT)25磁珠纯化原 理主要是mRNA的3′的poly A与磁珠在bindingbuffer的 作用下相结合。磁珠通过 MPC(磁分离器)从溶液 中分离出来。
• mRNA与磁珠结合后,再 用Tris-HCL在加热条件下 解离洗脱到溶液中。
新一代测序技术
Read Length 1×35 bp 2×35 bp 2×100 bp
Run Time ~1.5 days ~4 days ~8 days
Throughput : up to 25 Gb per day
Output 26-35 Gb 75-100 Gb 150-200 Gb
基于SBS测序技术
鉴定基因可变剪接
exon1
exon2
common reads
exon3
mRNA
junction reads
exon1
exon3
exon1
exon2
exon3
鉴定融合基因
Paired Reads distribution
Reads cluster
新转录本预测
Paired-End (PE) Reads
digital gene expression profiles. Genome Res. 1997 7(10):986-995
Alternative splicing and isoform
Unigene pathway 富集性分析
Pathway富集性分析列表
外一端随机和附近的另外一个引物互补,被 “固定”住,形成“桥”(bridge)。
• 形成的单链桥,以周围的引物为扩增引物,
在芯片表面进行扩增,形成双链。
• 双链经变性成单链,再次形成桥,并作为下
一轮扩增的模板继续扩增反应。
• 反复若干轮扩增,每个单分子得到了大量扩
增,成为单克隆“DNA簇群”。
生物信息分析
• 之后Saha提出了LongSAGE方法,将SAGE标签长度增 加到21bp,使得直接基因组注释成为可能。
• 衍生了一系列基于21bp标签的测序方法,如CAGE, MPSS,PET等,但是21bp的短标签注释仍然存在很 多问题,目前实验得到的标签约有一半无法注释到 基因组。
• Illumina Sequencing • 生物信息分析
相关主题