当前位置:文档之家› lncrna芯片分析-自己总结(1)

lncrna芯片分析-自己总结(1)

1
lncRNA芯片分析
lncRNA芯片分析 修改时间2010/6/16 13:57:12 点击3210次

1. 归一化
lncRNA芯片采用的归一化的方法为quantile normalization。

2. 差异LncRNA的筛选
lncRNA芯片中既有lncRNA的探针又有mRNA的探针,分别做差异基因的筛选,筛选方法同表达谱的筛选方法是一致的,参见表达
谱的差异基因筛选。

3. 差异lncRNA的重注释
lncRNA芯片注释不完善,因此需要将筛选出来的lncRNA进行重注释。将差异lncRNA在基因组上位置上下游延伸,以寻找lncRNA
附近的有功能的基因。

差异lncRNA重注释示例
4. 差异lncRNA靶基因的预测
lncRNA可能通过调控相应的mRNA发挥功能,因此有必要预测lncRNA的靶基因。我们提取差异lncRNA和mRNA的序列,首先用blast
进行初筛,之后用RNAplex进行进一步筛选,以预测lncRNA可能调控的mRNA。
2

差异lncRNA靶基因预测结果示例
5. 差异lncRNA与靶基因共表达网络
预测出lncRNA的靶基因后,并可进一步在mRNA的数据中探寻该mRNA是否发生表达量的变化。由此构建差异lncRNA与靶基因相互
作用网络图。

差异lncRNA与靶基因相互作用网络图。方框代表lncRNA,圆形代表mRNA。连线表示可能的调控关系。节点面积越大,表示调控的mRNA越多,
预示该lncRNA在调控网络中所起的作用可能越大。
6. 差异lncRNA与差异mRNA的共表达分析
SBC Human lncRNA芯片能同时检测出差异表达的lncRNA和mRNA。我们将差异lncRNA和差异mRNA在一组样品中进行共表达分析,
可以发现与某个lncRNA具有相同表达模式的mRNA。
要求:每组数据3个或3个以上生物学重复

实验组:
4
对照组:
5
lncRNA与mRNA共表达分析作用图,圆形带圈代表lncRNA,圆形代表mRNA。红色为上调基因,绿色为下调基因。
6

7. 差异lncRNA靶基因的GO analysis
对lncRNA的靶基因进行GO Ontology的生物学的分类,根据Fisher's Exact Test,得到p-value,得到lncRNA靶基因对应的显著
性功能,从而了解lncRNA的功能。

8. 差异lncRNA靶基因的pathway analysis
对lncRNA靶基因按照Pathway的主要公共数据库KEGG和Biocarta来进行分类,对Pathway中的基因进行基于离散分布的显著性
分析,得到与实验目的有显著联系的Pathway 分类,由这些pathway对应相应的靶基因,从而获得该分类即导致lncRNA差异的最重要Pathway。
9. 差异lncRNA的转录因子的预测
提取lncRNA TSS的上游2000bp,下游500bp,利用HMM的算法根据数据库预测其转录因子。

1) 芯片数据预处理:对实验数据质量评估,预处理及均一化处理。
2) 差异表达lncRNA及mRNA 的筛选:根据客户提供样本量的大小与分布或实验目的,应用倍数法、
多重假设检验等手段,对两条件或多条件下的表达差异的lncRNA和mRNA分别进行计算和筛选。

※ 表达模式聚类分析:针对芯片结果进行样本及差异表达lncRNA和mRNA的聚类,寻找属于同一表达
趋势的基因或样本。

※ GO和pathway显著性富集分析:差异基因,应用数据库进行功能富集分析,挖掘具有统计学意义
的差异表达基因的功能类别。显著性P值越小,则它随机聚集差异表达基因的概率越小,其功能相关性的
非随机性就越小,该功能模块有较大的可能与疾病(或药物作用) 相关。
※ 蛋白互作网络分析:研究与指定蛋白质相互作用的其他蛋白质的信息,以使研究人员能够更加深入
地认清相关蛋白质的功能,更清楚地理解其调控机制。

3) lncRNA-mRNA共表达分析:对于每一个差异表达的lncRNAs,计算得到与之共表达的编码基因。
4) lncRNA表达模式分析:考察差异表达LncRNAs 的表达模式,将LncRNAs 以及与该LncRNAs 显著共
表达的编码基因的表达模式绘制heatmap。

5) lncRNA功能预测:筛选出表达显著相关的lncRNA-mRNA 关系对,利用成熟的mRNA 的功能来推导
lncRNA 的功能,对异常表达lncRNA 显著相关的mRNA 进行功能富集分析。

6) lncRNA cis作用机制研究:对于感兴趣的差异表达lncRNAs,搜索其上下游100K范围内的所有编
码基因,并与该lncRNAs 有显著共表达的基因取交集。这些在基因组上临近、且表达模式上共表达的基因
很可能被该lncRNAs 所调控。

7) lncRNA trans作用机制研究:计算LncRNAs 共表达的编码基因,集合与转录因子/染色质调控复合
物的靶基因集合的交集,利用超几何分布计算该交集的富集程度,得到与lncRNAs 显著相关的转录因子,
从而识别可能与lncRNAs 联合发挥调控作用的转录因子/染色质调控因子。

※ lncRNA--转录因子二元关系及网络分析
※ lncRNA--转录因子--靶基因三元关系及网络分析

[综述]长链非编码RNA(lncRNA)

来源: 新药筛选中心 /点击: 1464
lncRNA
长链非编码RNA(long noncoding RNA,lncRNA)是一类不编码蛋
白的RNA 分子,长度在200bp 以上,起初被认为是RNA 聚合酶II 转
录的副产物,不具有生物学功能;近期的研究表明lncRNA 具有保守的
二级结构,可以与蛋白、DNA 和RNA 相互作用,参与多种生物学过程
的调控,尤其在肿瘤当中发挥了重要的调控角色,如染色质修饰、转
录激活和抑制、转录后调解以及作为miRNA 的诱导分子干扰基因的表
达等。随着高通量测序技术的发展,越来越多的lncRNA 被注释,但是
绝大多数的lncRNA 的功能仍然不清楚,因此lncRNA 的研究是一片非
常广阔的未知领域,具有极大的研究价值和意义。

lncRNA介绍
长链非编码RNA(long non-coding RNA,lncRNA)是一类转录本
长度超过200nt、不编码蛋白的RNA。lncRNA起初被认为是基因组转录
的“噪音”,不具有生物学功能。然而,近年来的研究表明lncRNA能
在表观遗传、转录及转录后水平上调控基因表达,参与了X染色体沉
默、基因组印记以及染色质修饰、转录激活、转录干扰、核内运输等
多种重要的调控过程,与人类疾病的发生、发展和防治都有着密切联
系。
为何细胞不惜耗费能量对这些非编码RNA的表达和定位进行严格
调控呢这些RNA分析究竟有何功能RNA测序技术的发展使人们得以初
窥这一神秘分子,现在lncRNA的许多相关信息都可以再新数据库中查
到,例如Broad研究所、哈佛大学和麻省理工共同开发的Human Body Map
lincRNAs catalog。虽然近年来关于lncRNA的研究进展迅猛,但是现
在人们了解到的lncRNA只是冰山一角,绝大部分的lncRNA的功能仍
然是不清楚的。随着研究的推进,各类lncRNA的大量发现,lncRNA的
研究作为RNA研究的新领域,已经成为一个非常吸引人的方向,有待
广大科学家去探寻。
lncRNA研究当前面临的一个主要挑战是,研究工具还在不断开发
和改进中,而lncRNA研究中非常关键的一步就是发现与特定疾病相关
的lncRNA。现阶段,基因芯片技术发展趋于成熟稳定,在此平台上,
通过设计不同检测lncRNA探针筛选lncRNA是一种准确快捷的方法。

lncRNA特征
lncRNA通常较长,具有mRNA样结构,有些具有poly(A)尾巴,有
些没有poly(A)尾巴,分化过程中有动态的表达与不同的剪接方式,与
编码基因相比,lncRNA表达量更低。
※ 组织特异性:不同组织之间的lncRNA表达量不同。
※ 时空特异性:同一组织或器官的不同生长阶段,其中的lncRNA
表达量也会变化。
※ lncRNA启动子同样可以结合转录因子,如Oct3/4,Nanog,CREB,
Sp1,c-myc,Sox2与p53,局部染色质组蛋白同样具有特征性的修饰
方式与结构特征。
※ 大多数的lncRNA在组织分化发育过程中,都具有明显的时空
表达特异性,如有人针对小鼠的1300个lncRNA进行研究,发现在脑
组织中的不同部位,lncRNA具有不同的表达模式。
※ 在肿瘤与其他疾病中有特征性的表达方式。
※ lncRNA的亚细胞位置上也呈多样化,在细胞核、细胞质和细胞
器均有分布,甚至某些lncRNA具有独特的亚细胞位置,有可能是全新
的亚细胞构成。

lncRNA功能


lncRNA可从染色质重塑、转录调控及转录后加工等多种层面实现
对基因表达的调控:
a) lncRNA通过招募染色质重塑复合物至特定的基因组位点使其发
生催化活性。如HOTAIR21,Xist、RepA和Kcnqot1招募Polycomb complex
至HoxD位点,使得X染色体或Kcnq1功能域的组蛋白H3 第27位赖氨
酸发生3甲基化(me3K27),诱导异染色质形成,从而抑制该区域基因

相关主题