当前位置:
文档之家› 高通量基因功能分析基因组学概论
高通量基因功能分析基因组学概论
TACATAGATA CCTAACACAA CTGTGCTGCA TTCATGGGGC ACACAGAGAA ACATGCAGGG
CAGGAGGCAA GGTGCAAAAA ACATGGTGGT TTGCGCACAT AATGGAAATG CACGTTACAA GTTGATCCAG
GGACTGgaaa ggcttcagaa gggagttttt gcctttctct ggatcaaata gcagttaggc gggatatata taggcataaa agatggatgt gtatctgctt
ggcctccaat aaggggtaat tatatcttag ttgggatcaa gtacaggtac tgttttatta ttacagagaa aagggaaatc atttaaccat taaataaacc
caatagggct gttctgcccc caataagggg taattatatc ttagttggga tcaagtacag gtactgtttt attattacag agaaagggga atcatttaac
tcaCTGTGTA TGATGGTCAC ATCAGGCAGT TTGTGGGGTG ATAGTTGATA GTAATTTATA GAGAAGTACT
GATTTGCTTT AATACAGTAA CCTATGGCAA TTGGGCATTT GCATCATCGA CTAACCTGCT CTGTTCCAAT
SAGE技术不是研究完整的cDNA,它产生长 度12bp~20bp的短序列,每一条都代表了转录 组中存在的一种mRNA。
该技术的基础是:尽管这些12bp的序列短,但 是却足够用来确认编码这些mRNA的基因。
基因组学概论
15
通过序列分析研究转录组
4的12次方=16Mbp,真核mRNA长度1500bp, 所以4的12次方相当于11000个转录物的总长 度。该数目几乎比最复杂的转录组中可能存在 的转录物数都要多。
ATGACAATGC TCCACTGTCT TCATTAATAA GCTTTACAAG ACAGACGTTC TATATTGCCT TTGCTTTCTT
CTCTGTTGGT CGTGATGAGG AAAGCAAAAC TGCTGGCACT GGCTTAATGT TTCAATGGTC TATAATTATG
ACAAGCTGGG TCTAATAGAC ATTTTGCACA AATACATGGC AAAGAAAAAA CTTTGCCCAA
TTTTGAGACA GTAACTTTTC
AGAGAATCAAAGAGTTGACTAGCGAGGGACTTAAGsCGeCAqGTuCGTeGAnGAcAGeGGAA?ATGGTGCACTGCACAAATCGACACATTCACGCACCCAAACTCTTAAACACACTAATCTTATTGACACACAAGTTTG
该方法可行,但却艰巨。因为几个不同的转录组 (比 如不同组织或不同细胞) 的cDNA序列的获得很耗时。
是否有什么捷径可以用来更快地获得关键序列的信息 呢?
基因组学概论
14
通过序列分析研究转录组
基因表达系列分析 (Serial analysis of gene expression, SAGE) 技术提供了一个解决方案。
TGTTTGCGTT TATATATTTA GTCCTTCTCT TTTGAATGTT TCTGTGGTAT TGTATAGATA ACCAGATTCT
GTGCAGGGGC GGGAGGTACA ATTAATACCC TAACGAAAGC TTCATGAGGA AAAGGCATGG
CTAGAAAAAC ATTTCCTGCT TAGGAACCAA AGCAGCAATA GCAGAAGATT GTGGGTTGCT GGGTCTGATG
taagctctaa actcatgata aatctgcccc TAAGTGAAGC CTCCTTGTTT TCTACCCTTA TTTTACAAAG TGTATCTAAC
AGAACTACTA CTGGCTACAA AACACTGTAA AAAAAACTTC AGTTGGAGTT TCACTTCTCC ATTGCCCAGC
细胞的生物化学
基因组学概论
7
基因组告诉你,理论上能够发生什么? mRNA告诉你,可能发生什么? 蛋白质组告诉你,正在发生什么?
基因组学概论
8
5.2.1 转录组研究
基因组学概论
9
5.2.1 转录组研究
转录组的组成高度复杂,包含成百上千种不同的 mRNA,每一个转录组都是基因组整体转录信息的 一个不同部分。
转录组 Transcriptome
转录后的所有mRNA的总称
翻译
基因组表达的第二个产物是蛋白 质组:即细胞中那些决定细胞能 够进行生化反应的所有蛋白质组 分。蛋白质组是连接基因组和细 胞生物化学之间的一部分。
蛋白质组 Proteome
一个细胞中的基因组所表达的全套蛋白质
蛋白质组活性
BiTGCTGCCTGA TTACTATGGG TTACAGCACT GAATCAAACC TGAAGGTACA ATATTGGATT
AAATTAGTAG ATATAATAAT CTGACAATCA CACAATGCTt cccatagaaa tgaatagaat gtgggtgggt ttttatgtat
功能基因组学 (functional genomics):了解基因组活 性整体研究的方法。
基因组学概论
6
5.2 高通量基因功能分析
基因组是一个生物信息库,但是 仅仅靠其自身还不能将这些信息 传递给细胞。
基因组 Genome
一个细胞的全套染色体
转录
基因组表达的最初产物是转录组: 即那些含有细胞在特定时间和空 间所需生物信息、编码蛋白质的 基因衍生而来的RNA分子的集合。
基于杂交的方法
微阵列(microarray)或芯片(chip)分析
通过第二代高通量测序
RNA-seq
基因组学概论
12
5.2.1 测定基因表达水平的方法的优缺点
实验技术
低通量,单个基因的表达水平测定方法
基于序列分析 EST(低通量) 基于标签的方法 (高通量;但是成本高)
基于杂交的方法
一个生物体的不同组织细胞、细胞内的不同位置、 细胞的不同时刻都具有不同的转录组。
要描述一个转录组就有必要确认该转录组中所
包含的mRNA,最理想的是能够确认这些 mRNA的相对丰度。
基因组学概论
10
5.2.1 转录组研究
转录组的组成高度复杂,包含成百上千种不同的 mRNA,每一个转录组都是基因组整体转录信息的 一个不同部分。
cattaaataa acccaatagg gctgttctgc ccccaataag gggtaattat atcttagttg ggatcaagta caggtactgt tttattatta cagagaaaag
ggaatcattt tataaaatta aaattatttg cttataatgg tgtctatggg agacagcctt tctgtaattc tgaacttctt ggataacggg tttccggata
function)
基因组学概论
5
5.2 高通量基因功能分析
即使基因组注释后所有基因的功能都已经被确定了,人 们仍然想知道:
理解在细胞中基因组是如何以一个整体来执行功能, 并使得各种生物化学反应明确而协调地发生。
这些全局性的基因组活性研究不仅仅需要阐明基因组 自身,还需要阐明转录组及蛋白质组如何建立和协调 基因组的表达。
CAGTAACTAG GAATTCAAAA CCAGTCCCAA GTGTGCATTT TCGACACCTT CCTCTTCAGA AACAAGGTTT
GTTTTGGTAA GAAAATCTCT GACCATTTTA TAATATTACA CATTGCCACT CAAAAATGAC GCCATTTAGA
agggatccca tacctgtaCT AAAWAAhAaAtAAdGoAyCoCuAGAAAGA ACTGCACACT CAGGGAAAAG AAAAAAAGTT
TATTTATATA TCATTTTTTG
TTACTAACGTACGTCTCGthTAiGAnGAkAGToTTGfTAtThTGAiGsAGA
GACAGAAATC AGAAACTACC ACACCCTCCT TCCATTCTAA ATATGTGGAA TTGCCTGTAA GTTAGGTAGT
TTTTGAATAT CCCACAGTAG AATAAAGGTA AGACTAAGAA CTGTATACTG ATGACAGTAG ATTGTCTGTG
实验技术
RT-PCR
Nothern blot
基于序列分析
EST:Expression sequence tag (~400bp, 20-7000bp)
基于标签的方法
CAGE: Cap analysis of gene expression (~12-20bp, 5’ ends)
SAGE: Serial analysis of gene expression (~12-20bp, 3’ ends)
高通量基因功能分析
基因组学概论
5.基因组序列注释
生物信息+生物实验 1. 基因组序列注释:基因组序列所包含的全部
遗传信息是什么?
用什么方法寻找基因? 用什么方法研究基因的功能?
2. 高通量基因功能分析:基因组作为一个整体 如何行使其功能?
基因组学概论
2
基因预测
(Gene prediction)
要描述一个转录组就有必要确认该转录组中所包含 的mRNA,最理想的是能够确认这些mRNA的相对 丰度。
1. 通过序列分析研究转录组 (了解) 2. 通过微阵列或芯片分析来研究转录组 (重点) 3. 通过RNA-seq高通量测序来研究转录组 (知