当前位置:文档之家› 真核生物基因结构的预测分析

真核生物基因结构的预测分析


10
ORF识别: GenomeScan
/genomescan.html
提交待分析序列
提交同源蛋白质序列
11
运行GenomeScan
GenomeScan输出结果:文本
预测外显子位臵、可 信度等信息
同源比 对信息
预测结果的氨基酸序列
12
GenomeScan输出结果:图形
22
DBTSS搜索结果
23
FXYD5基因的启动子区域显示
SNP位点
覆盖的cDNA序列数目 转录起始位点TSS
DBTSS图例说明
24
ALB基因的启动子区域显示
TF:转录 因子结合 位点
覆盖的cDNA序列数目
转录起始位点TSS
25
下载启动子序列
下载启动子区序列 设臵下载序列的起点、终点
需选择转录起始位点
成熟mRNA
5’
AAUAAA
CAAAAAAAAAAAAA
3’
下游作用元件:GC rich二重对称区、UUUUUU
RNA 5’
UUUUUUUUU C-G C-G G-C G-C U-A G-C G-C C-G G-C
3’
31
转录终止信号polyA预测:POLYAH
/berry.phtml?topic=polyah&group=programs &subgroup=promoter
13
课堂练习
• 1使用GENESCAN预测序列中可能的ORF。 • 2使用GENOMESCAN预测序列中可能的 ORF。
• 练习用的序列文件在c:\zcni\shixi2文件下, 名字为clone.fasta,使用写字板打开查看。
14
转录调控序列分析
15
启动子区结构
启动子(Proபைடு நூலகம்oter)
位于结构基因5’端上游,能活化RNA聚合酶,使之与模板 DNA结合并具有转录起始的特异性。 转录起始位点(Transcription start site, TSS)
PYCAPY(嘧啶)
核心启动子元件(Core promoter element) TATA box,Pribnow box (TATAA)
上游启动子元件(Upstream promoter element,UPE)
CAAT box,GC box,SP1,Otc
增强子(Enhancer)
16
Fgenes FgeneSV Generation FGENESB GenomeScan GeneWise2
Softberry Softberry ORNL Softberry MIT EBI
人(基因结构) 病毒 原核 细菌(基因结构) 脊椎、拟南芥、玉米 人 7 人、小鼠、拟南芥、果蝇
GRAIL
/grailexp/
CpG Island 分析
CpG Island CpGPlot CpG finder CpGi130 CpGproD /cpgislands2/cpg.aspx /emboss/cpgplot/index.html /berry.phtml?topic=cpgfinder& group=programs&subgroup=promoter /CpG130.do http://pbil.univ-lyon1.fr/software/cpgprod_query.html Web Web Web web web
19
PromoterScan输出结果
找到的TATA box和转录起始位点
预测可能的转录因子
转录因子在提交序列中的位臵
20
转录起始位点数据库:DBTSS
http://dbtss.hgc.jp/
21
DBTSS搜索工具条
限定物种“H. sapiens” 最新数据库版本加入Solexa测序新数据支持 限定搜索“基因名称” 搜索基因“FXYD5” 限定至少需要多少条cDNA序列覆盖
ORNL
ORF识别:GENSCAN
选择物种类型
/GENSCAN.html
是否显示非最优外显子 序列名称(可选) 显示氨基酸或CDS序列 提交序列文件
提交序列
结果返回到邮箱(可选)
8
运行GENSCAN
GENSCAN输出结果:文本
9
GENSCAN输出结果:图形
如何分析mRNA/cDNA的外显子组成?
通过对特征序列(GT-AG)的分析进行直 接的预测基因预测软件(NetGene2)
与相应的基因组序列比对,分析比对片 段的分布位臵(Spidey)
35
36
剪切位点识别:NetGene2
http://www.cbs.dtu.dk/services/NetGene2/
BLAST比对到的三条mRNA序列
40
Spidey序列提交页面
输入基因组序列或序 列数据库号
输入相似性序列 判断用于分析的序列间的差异, 并调整比对参数 比对阈值 不受默认内含子长度限 制, 默认长度:内部内含子 为35kb, 末端内含子为 100kb 输出格式选择
选择物种
41
Spidey输出结果
原核和真核生物基因转录起始位点上游区 结构
原核生物
-35 -10 +1 mRNA
TTGACA
TATAAT
A
真核生物
-110 -40 -25 +1
mRNA
GC区
增强子
CAAT区
TATAAT
PyCAPy
上游启动子元件,UPE
核心启动子元件
转录起始 位点
17
启动子结合位点分析常用软件
PromoterScan Promoser Neural Network Promoter Prediction Softberry: BPROM, TSSP, TSSG, TSSW MatInspector
:80/molbio/proscan/ /zlab/PromoSer/ /seq_tools/promoter.html /berry.phtml?topic=index&gr oup=programs&subgroup=promoter http://www.gene-regulation.de/ Web Web Web Web Web
提交序列 提交序列文件
32
POLYAH输出结果
GENESCAN预测结果 PolyA位点52398bp
polyA位臵
33
课堂练习
• 使用CpG plot预测clone.fasta中的CpG 岛。 • 使用POLYAH预测clone.fasta中的POLYA 剪切位点。
34
内含子/外显子剪切位点识别
5
开放读码框的识别
• 开放读码框(open reading frame, ORF) 是一段起始密码子和终止密码子之间的碱基序列 • ORF 是潜在的蛋白质编码区
6
基因开放阅读框/基因结构分析识别工具
ORF Finder BestORF GENSCAN Gene Finder FGENESH GeneMark GLIMMER /gorf/gorf.html /berry.phtml?topic=bestorf& group=programs&subgroup=gfind /GENSCAN.html /tools/genefinder/ /berry.phtml?topic=fgenesh &group=programs&subgroup=gfind /GeneMark/eukhmm.cgi /genomes/MICROBES/gli mmer_3.cgi /software/glimmer /berry.phtml?topic=fgenes& group=programs&subgroup=gfind /berry.phtml?topic=virus&gr oup=programs&subgroup=gfindv /generation/ /berry.phtml?topic=fgenesb &group=programs&subgroup=gfindb /genomescan.html /Wise2/ NCBI Softberry MIT Zhang lab Softberry GIT Maryland 通用 真核 脊椎、拟南芥、玉米 人、小鼠、拟南芥、酵母 真核(基因结构) 原核 原核
真核生物基因的主要结构
4
基因结构分析常用软件
开放读码框 GENSCAN GENOMESCAN CpG岛 转录终止信号 启动子/转录起始位点 CpGPlot
基因结构分 析
POLYAH PromoterScan DBTSS database NETGENE2
mRNA剪切位点 Spidey 选择性剪切 ASTD
实习二 真核生物基因结构的预 测分析
浙江加州国际纳米技术研究院 2009年11月
1
课程内容
实习一 实习二 基因组数据注释和功能分析 真核生物基因结构的预测分析
基因组学 系 统 生 物 学
实习三
实习四 实习五 实习六
芯片的基本数据处理和分析
蛋白质结构与功能分析 蛋白质组学数据分析
转录物组学
蛋白质组学
RSAT
Cister
http://rsat.ulb.ac.be/rsat/
/~mfrith/cister.shtml
Web
Web
18
启动子预测:PromoterScan
/molbio/proscan/
提交序列
系统生物学软件实习
2
基因组功能分析
基因组序列 cDNA序列
翻译
编码区预测
基因结构分析
蛋白质序列
相关主题