当前位置:
文档之家› 长链非编码解读15.1.14
长链非编码解读15.1.14
内容提纲
1 3 2
LncRNA研究简介 LncRNA实验流程 LncRNA生物信息分析
3
LncRNA测序实验流程
rRNA去除
lncRNA建库原理
转录组建库原理
链特异性测序建库原理
内容提纲
1 3 2
LncRNA研究简介 LncRNA实验流程 • 转录本构建工具
LncRNA生物学功能
lncRNA 功能
Xist
染色质重塑:Xist广泛地覆盖在X染色体上,占据RNA pol Ⅱ的结 合位点,募集PRC2诱导异染色质化的形成,通过组蛋白类似物 macroH2A催化CpG岛甲基化,导致X染色体失活
Fenderr
组蛋白修饰:分别与PRC2和wdr5相互作用,形成抑制性和激活性 的组蛋白标记,参与心脏的发育进程 DNA甲基化:招募DNMT到DHRS4L2基因的启动子区,诱导DNA 甲基化的形成,抑制DHRS4L2基因的转录
LncRNA特征
mRNA与lncRNA的长度比较分析
LncRNA特征
mRNA与lncRNA的exon个数比较分析
LncRNA特征
mRNA与lncRNA的isoform个数比较分析
LncRNA特征
mRNA与lncRNA表达水平比较分析
LncRNA生物学功能
LncRNA生物学功能
COOLAIR 是一个来自 FLC 位点反义链的 长非编码 RNA 。在受到寒冷刺激后, COOLAIR 上调表达,通过影响染色质 修饰来下调正链编码的 FLC基因的表达 (Swiezewski et al., 2009)。 COLDAIR 也是一个来自FLC 位点的长非 编码RNA,COLDAIR 来自 FLC 基因的第 一个内含子。同样在受到寒冷刺激后 上调表达, COLDAIR 被证明是通过与 PRC2 复合体相互作用,增加 FLC基因 染色质位点上 H3K27me3 修饰来抑制 FLC 基因的表达 (Heo et al, 2011)。
长链非编码研究
内容提纲
1 3 2
LncRNA研究简介 LncRNA实验流程 LncRNA生物信息分析
3
LncRNA简介
◆ 长度在200nt以上的RNA。 ◆不编码蛋白。 ◆哺乳动物基因组中4~9%的序列转录本是lncRNA
(mRNA占1%)。
LncRNA分类
根据lncRNA 在基因组上的位置,可将其分为 5 种类型: 1. sense, 2. antisense, 3. bidirectional, 4. intronic, 5. intergenic。
– Cufflinks(最少可变剪切组合,转录本更长)
– Scripture(最多可变剪切组合,转录本更全)
区分编码RNA和非编码RNA的工具
CPC :基于预测基因的开放阅读框
PhyloCSF:基于物种间的保守性
CNCI:基于二联密码子频率
Pfam:基于蛋白结构域分析
LncRNA靶基因预测
Cis靶基因预测:取同一条染色体上的lncRNA上下 游10kb范围内的基因利用基因组注释和基因组浏览 器鉴定lncRNA的可能的靶基因。 Trans靶基因预测:不同染色体的靶基因预测利用 RNAplex或WGCNA等鉴定lncRNA的可能的靶基因。
AS1DHRS4
玉米lncRNA的全基因组挖掘和特征分析
研究数据
• NCBI EST数据;
• 全基因组测序注释文件;
• 30个不同实验转录组测序数据。
分析流程
研究结果
• 全基因组 lncRNA 筛选:筛选标准:大于 200bp ;
ORF 长 度 小 于 100aa ; CPC 分 析 :swiss-port 比 对 Evalue ≤ 0.001 。共得到 20,163 潜在的 lncRNA, 其中基 因组测序得到12,431个位点(12,647 isoforms),转 录组测序得到7,177个位点(7,515 isoforms)。
研究结果
• 18,459个位点是pre-lncRNAs,作为small RNA的前体。
1,704 个 与 已 知 非 编 码 种 类 不 同 的 序 列 作 为 HClncRNAs 。 24 个 lncRNA 利用 RT-PCR 的方法进行了验 证。
研究结果
• 玉米 lncRNA 的特征分析: 74% 的 pre-lncRNAs 来自
于重复序列区间,98%的HC-lncRNAs不包含重复序 列( 68% 的潜在 lncRNAs 来自于重复序列,与哺乳 动物类似)。仅有 7% 的 lncRNA 与编码的 mRNA 序 列重叠。81%的lncRNA仅具有一个外显子。
研究结果
• 组织间lncRNAs的表达分析:30个转录组数据分析
了 13 个不同组织的表达, 54% 的 lncRNAs 仅在一个 组织中检测到,仅有8%的基因在一个组织中检测 到。10%的lncRNAs 在5个以上组织中检测到,74% 的基因在5个以上组织中检测到。13个组织中,基 因的表达量显著的高于lncRNAs。
差异表达LncRNA靶基因KEGG注释
差异表达LncRNA靶基因KEGG通路富集分析
差异表达LncRNA-mRNA调控网络分析
LncRNA-miRNA调控网络分析
• • • • • lncRNA中endo-siRNA分析; lncRNA中miRNA前体分析; miRNA靶向lncRNA分析; miRNA decoy功能的lncRNA分析; miRNA-mRNA-lncRNA调控网络分析。
差异表达LncRNA筛选
•差异表达LncRNA的检测:
DESeq 适应于有生物学重复样品的差异分析 EBSeq 适应于无生物学重复样品的差异分析
差异表达lncRNA筛选标准:FDR<0.01且Fold Change>=2
差异表达LncRNA靶基因的GO分类
差异表达LncRNA靶基因GO富集层次分析