当前位置:文档之家› 华南农业大学生科院-生物信息学基因组

华南农业大学生科院-生物信息学基因组


Re-sequencing
Alignment is the fundament of Resequencing
Find the sequence read’s placement in reference genome For SNP detection For short InDel detection For Structure variation detection ……
(2006)
http://www.hmdb.ca/
DNA测序 ——生物学数据的主要源泉
传统的DNA测序技术 新一代DNA测序技术
Sanger sequencing 双脱氧链末端终止法
四种不同荧光素标记 毛细管电泳
Frederick Sanger
基因组测序策略
基于鸟枪法(Shotgun)的随机测序策略 基于遗传图谱和物理图谱的定向测序策略
宏基因组学(Metagenomics)
/cgi-bin/GOLD/index.cgi
宏基因组学研究方法
全基因组测序,高通量,全面分析微生物群体的
物种、基因功能组成等。
国际上已经进行的宏基因组项目
http://www.metahit.eu/
指在大规模水平上研究蛋白质的结构和功能,包括蛋白质 表达水平,翻译后修饰,蛋白相互作用等,由此获得蛋白质 水平上关于疾病发生、细胞代谢等过程的全面整体认识。
人类基因组中编码蛋白质的基因数远少于人类蛋白质组 中的蛋白质数(约 33,000 个基因,约 200,000 个蛋白质)。 挑战:对所有蛋白质分类并确定它们的功能和相互作用。
MAS(Molecule Annotation System) /
蛋白质组(Proteome)
一个生命体在其整个生命周期中所拥有的蛋白质总和,或 者指特定类型的细胞在经历特定类型刺激时所拥有的蛋白质 总和。 蛋白质组学(Proteomics)
SNP (single nucleotide polymorphism) identification
Identification of CNVs (copy number variation)
Identification of structural variation
Detection of deletion and insertion
Mapping and de-novo assembly
Sequence the human genome
Build human genetic variation map -International 1000 genoes project
Sino-Danish genmoe-wide association study on metabolic disorders
转录组(Transcriptome)
特定细胞在某一功能状态下所能转录出来的所有 RNA 的总和,包括编码mRNA和非编码RNA。
Transcriptome sequencing
补充:
1. 转录组测序不同于以往的数字化表达谱测序(原理是利用NlaIII酶 选择性地构建 mRNA5000~6000元/样品)。 2. 转录组测序( RNAseq )目前主要有两种策略:短片段(~ 35 bp ) 和长片段(~70 bp)。 3. 短片段的转录组测序一般用于研究样品之间的相对表达,即哪些基 因发生上下调。一般是 6 M reads ,数据量大约 200 M , 8500 元 / 样 品。 4. 长片段的转录组测序除了研究基因相对表达之外,还可以研究可变 剪接、融合基因及 LncRNA等,尤其多用于非模式物种(或者无基因 组测序的物种)的测序,一般是 15 M reads ,数据量 1 G 左右, 15000元/样品。
ot01-102 bp)
mRNA Splicing
isoform 1
isoform 2
isoform 3
Homologous sequences
Orthologs (直系同源):来源于不同物种中由
共同祖先进化而来的蛋白质,并且典型保留与原始
增加了遗传图的分辨率和准确性 有利于基因组测序和测序后的拼接
Chr3_Physical Map
全基因组DNA测序
最详细、最准确的物理图谱
功能基因组学的主要研究内容
基因组功能注释(Genome annotation) 预测基因、基因和蛋白质序列及结构分析 分析基因的功能 同源性搜索、EST分析、反向遗传学、实验设计 基因表达模式分析 基因芯片、转录组测序、蛋白质组学 比较基因组学研究 全基因组比较
优越性:来自DNA序列水平上的变异,数量大;遗传物
质水平上的变异,不受生育期及环境的影响;共显性或
显性遗传。
http://rgp.dna.affrc.go.jp/E/Publicdata.html
物理图谱
利用限制酶将染色体切成片段,借助遗传图谱,确 定片段之间的重叠关系及分子标记之间的物理距离, 建立一个可覆盖染色体区域的片段重叠群(contig)。
结构基因组学(structural genomics)
通过基因组作图、核酸序列分析确定基因组成、基因定位的
科学,即全基因组测序。 功能基因组学(functional genomics):利用结构基因组所 提供的信息,从全基因组水平分析基因的功能,包括研究基 因的表达及调控途径,也称后基因组( postgenomics )学。
第二章 基因组学基础
基因组学是生物信息学的主要内容
基因组(genome) 泛指一个有生命体、病毒或细胞器的全部遗传物质。在真核
生物中,基因组指一套染色体(单倍体)DNA。
基因组学(genomics)
利用基因组作图、测序新技术以及计算机,对核酸序列进行
分析,以了解生命体的全部基因组结构及其功能。
5’
3’
~ 1-100 Mbp
3’
5’
5’ … … 3’
~ 1-1000 kbp
… 3’ … 5’
exons (cds & utr) / introns (~ 102-103 bp) (~ 102-105 bp) promoter (~103 bp) Polyadenylation site
enhancers (~101-102 bp)
蛋白质相同的功能。
Paralogs(旁系同源):来源于同一物种中因基
因复制而产生的蛋白质,可能会进化出新的与原始
蛋白质有关的功能。
代谢组学(Metabolomics) 通过考察生物体系受刺激或扰动前后(如将某个特定的基因变 异或环境变化后 ) 代谢产物的动态变化,研究生物体系的代谢 网络。 优点:1)不需进行全基因组(或转录组)测序
2)代谢物种类远少于基因和蛋白质的数目
3)代谢物分析可直接反映机体系统的生理和病理状态
HGP计划、Sanger法原理及定向测序策略
基因组测序策略
高通量测序技术
Illumina/Solexa/HiSeq2500测序
Sequencing-by-Synthesis (SBS)
Base calling
新一代测序技术大大促进生物信息 学的开发应用
大规模重测序(Large-scale re-sequencing) 转录组(Transcriptome)测序 宏基因组学(Metagenomics)测序
结构基因组学研究有关技术
利用分子标记技术结合遗传学分析构 建遗传图谱(Genetic Map) 构建物理图谱 ( Physical Map) 全基因组DNA序列测定
遗传图谱
采用遗传学的连锁分析方法,把遗传标记按其遗 传距离线状排列,标定在染色体上而构建成。
DNA分子标记:以个体间遗传物质内核酸序列变异为基 础的遗传标记,是DNA水平遗传多态性的直接反映。
相关主题