当前位置:文档之家› 生物信息学-功能基因组学

生物信息学-功能基因组学


因此,可以估计1/4 ~ 1/3的转录因子受到SUMO化的调控
Bioinformatics, 2008-2009, Semester 1, USTC
4. 基因/蛋白质的功能预测
(1) 一级序列的比较:相似的序列具有相似 的功能 (2) 保守的功能结构域:保守的功能 (3) 三级结构的比较:相似的结构具有相似 的功能 (4) 蛋白质相互作用的预测
(3) 可变剪切的预测
将EST, cDNA序列比对到基因组上
Bioinformatics, 2008-2009, Semester 1, USTC
部分有向图算法
Bioinformatics, 2008-2009, Semester 1, USTC
3. 比较基因组学
(1) 有功能的通常保守 (2) 例:SUMO底物的预测:
Transposon
转座子:在基因组中能够移动位置的DNA 序列
Bioinformatics, 2008-2009, Semester 1,
2. 基因组注释
(1) 基因组序列的拼装
(2) 基因预测
(3) 可变剪切的预测
(4) 非编码的功能元件的预测
Bioinformatics, 2008-2009, Semester 1, USTC
(2) 基因预测
直接的,序列高度匹配
同一或近缘物种中,与EST,cDNA, 蛋白质 等序列完美或近似完美的匹配
间接的,基于统计学的
a.序列比对 (Homology) b.从头预测(ab initio) c.以上两种方法的结合
Bioinformatics, 2008-2009, Semester 1, USTC
本章内容提要
1. 基因组的结构与内容
2. 基因组注释
3. 比较基因组学
4. 基因/蛋白质的功能预测
Bioinformatics, 2008-2009, Semester 1, USTC
1. 基因组的结构与内容
(1) 基因的结构 (2) mRNA:可变剪切 (3) 蛋白质:翻译后修饰 (4) 相互作用网络:基因、蛋白质、小分子之间 的相互作用 (5) 非编码区
功能显著性分析:超几何分布
Bioinformatics, 2008-2009, Semester 1, USTC
Bioinformatics, 2008-2009, Semester 1, USTC
转录因子
In human proteome:
DNA binding (GO:0003677): 2, 255 Transcription factor activity (GO:0003700): 1, 102 regulation of transcription, DNA-dependent (GO:0006355): 2, 174
a. 功能元件: 转录因子结合位点;启动子… b. Non-coding RNA: MicroRNA c. 转座子 d. 重复片段 e. 伪基因 (Pseudogene)
Bioinformatics, 2008-2009, Semester 1, USTC
(1) 基因的结构
Bioinformatics, 2008-2009, Semester 1, USTC
Ubiquitination Acetylation Bioinformatics, 2008-2009, Semester 1, USTC
(4) 相互作用网络
蛋白质-蛋白 质相互作用 网络
Bioinformatics, 2008-2009, Semester 1, USTC
细胞信号通路
G1/S检验点: 有调控方向
Bioinformatics, 2008-2009, Semester 1, USTC
(1) 一级序列的比较
1. 同源物的鉴定:不同物种中的直系、旁系 同源物的预测 2. 主要工具:BLAST
Bioinformatics, 2008-2009, Semester 1, USTC
(2) 保守的功能结构域
Bioinformatics, 2008-2009, Semester 1, USTC
microRNA/miRNA
1. 长度21-23bp 2. 调控基因的表达 3. pre-miRNA: ~70bp
Bioinformatics, 2008-2009, Semester 1, USTC
真核生物的基因结构
5’ ~ 1-100 Mbp 3’
3’
~ 1-1000 kbp
5’
5’ … … 3’
… 3’ … 5’
exons (cds & utr) / introns (~ 102-103 bp) (~ 102-105 bp)
promoter (~103 bp)
enhancers (~101-102 bp)
1. 保守的功能结构域:保守的功能 2. 常用工具:
工具 Interpro Pfam SMART PROSITE ProDom CDD 网址 /interpro/ / http://smart.embl.de/ /prosite/ http://prodom.prabi.fr/prodom/current/html/home.php /Structure/cdd/wrpsb.cgi
Functional elements: Promotor
Bioinformatics, 2008-2009, Semester 1, USTC
Transcription Factor Binding Site
CRM: cisregulatory modules
Bioinformatics, 2008-2009, Semester 1, USTC
Bioinformatics, 2008-2009, Semester 1, USTC
HMM model for Gene Prediction (Genie)
Kulp, D., PhD Thesis, UCSC 2003
Bioinformatics, 2008-2009, Semester 1, USTC
c. Molecular function:我是谁?
Bioinformatics, 2008-2009, Semester 1, USTC
Gene Ontology:基因本体论
Bioinformatics, 2008-2009, Semester 1, USTC
Bioinformatics, 2008-2009, Semester 1, USTC
a. SUMO化位点存在ψ-K-X-E模体 b. 核定位信号 (NLS) c. 人和小鼠中,SUMO化位点应当保守 d. 功能分析:Gene Ontology
(3) 分析结果:
a. 2,683个人-小鼠保守的SUMO化底物 b. SUMO化的功能:参与转录调控、信号转导等
基因组大小 & 基因数
Bioinformatics, 2008-2009, Semester 1, USTC
基因数量 -> 生物复杂性?
1. 基因数量的变化,无法解释生物学功能、调控机
理以及物种多样性和复杂性的巨大变化
2. 当前解释:蛋白质组的多样性和复杂性 -> 物种的
多样性和复杂性;~10,000,000种蛋白质分子 3. 两种观点:
转录后层面:mRNA Splicing
mRNA Splicing
isoform 1
isoform 2
isoform 3
Bioinformatics, 2008-2009, Semester 1, USTC
蛋白质层面:翻译后修饰
Sumoylation
Phosphorylation Palmitoylation
In SUMO Substrates:
DNA binding (GO:0003677): 530 Transcription factor activity (GO:0003700): 304 regulation of transcription, DNA-dependent (GO:0006355): 510
(1) 基因组测序:鸟枪法
Bioinformatics, 2008-2009, Semester 1, USTC
基因组的拼装
Bioinformatics, 2008-2009, Semester 1, USTC
重复序列带来干扰
Bioinformatics, 2008-2009, Semester 1, USTC
Bioinformatics, 2008-2009, Semester 1, USTC
(5) 非编码区
a. 功能元件: 转录因子结合位点;启动 子… b. Non-coding RNA: MicroRNA
c. 转座子
d. 重复片段
e. 伪基因 (Pseudogene)
Bioinformatics, 2008-2009, Semester 1, USTC
生物信息学
第七章 基因组分析
Bioinformatics, 2008-2009, Semester 1, USTC
人类基因组计划
Bioinformatics, 2008-2009, Semester 1, USTC
基因组、转录组和蛋白质组
基因组 转录组 蛋白质组 化学生物学
Bioinformatics, 2008-2009, Semester 1, USTC
Bioinformatics, 2008-2009, Semester 1, USTC
Gene Ontology:基因本体论
相关主题