基于组学的复杂疾病研究
(/10005107)
目的:分析“垃圾序列”的功能
(旨在识别出人类基因组序列中的所有功能区, 包括转录、转录因子结合、染色质结构和组蛋白 修饰区)
选样:147个组织类型 成果:43篇文献(5篇Nature) 结论:人类基因组中80%的成分是
有功能的
寻找“丢失的遗传度”
• 极少数SNPs有明确的与疾病机制相关联的功能性作用 • 鉴定出的风险等位基因通常效应值很低,只能解释极少的遗传度; • 对于大多数常见疾病,至今为止发现的风险位点共同作用也只能解释 较少的表型差异,大大低于该种疾病的估算遗传度;
对SNP的解读——从编码区到noncoding区
noncoding区域可为GWAS研究提供新的关注点
novo突变在疾病发生过程中的
作用。
复杂疾病de novo 突变研究-解决方案
疾病样本选取*1(trios or 父母+患病孩 子 )或10-20组quads家系(父 母+患病双胞胎 )
外显子捕获
Stage I
Illumina HiSeq 2000 测序 (>30X) 基本生物信息分析
De novo gene mutations highlight
patterns of genetic and neural complexity in schizophrenia
2012
NG
精神分裂症
Exome sequencing in sporadic autism spectrum disorders identifies severe de novo mutations Sporadic autism exomes reveal a highly interconnected protein network of de novo mutations Whole-genome sequencing in autism identifies hot spots for de novo germline mutation Detection of Clinically Relevant Genetic Variants in Autism Spectrum Disorder by Whole-Genome Sequencing
cell
自闭症
发现581个胚系de novo突变,每 个后代平均包含58个de novo 突变 6个家系发现有害de novo突变, 10个家系发现x连锁或常染色体遗 传变异。4个genes从未发现,9个 已知,8个候选ASD风险基因 329个de novo突变,锁定在9个基 因(2个从未与该病关联,2个偶尔
代谢组
蛋白组
1) 疾病biomarker,e.g. 心肌 肥大病人药物处理不同时间段,冠 状静脉窦取血;不同癌症发病阶段, 发现早诊biomarker 2) 疾病机理研究,e.g.尿结石患 者尿液 vs. 正常人尿液
复杂疾病研究的角度——基因组
检测单个突变 (100 SNPs; 103 genotypes) 针对具体的基因 (102 SNPs; 105+ genotypes) 区域研究 (104 SNPs; 108 genotypes ) 全基因组关联分析(GWAS) (106 SNPs; 1010 genotypes)
Nat Rev Genet. 2010 Jun;11(6):446-50.
Solutions for “missing heritability”
(Beyond GWAS)
复杂疾病de novo 突变研究(低频或罕见变异)
MHC与疾病研究(目标区域挖掘低频变异) eQTL表达数量性状(构建gene互作网络) 疾病动物模型机理多组学研究(突破样品局限) 免疫组库与临床研究(临床应用潜力)
De novo mutations in the gene
encoding the synaptic scaffolding protein SHANK3 in patients ascertained for schizophrenia A de novo paradigm for mental retardation Increased exonic de novo mutation rate in individuals with schizophrenia Exome sequencing supports a de novo mutational paradigm for schizophrenia
de novo 突变分析*2
候选de novo 突变 技术验证:Sanger测序/质谱 大样本量验证:家系或其它对照 疾病相关de novo 突变
改进过滤法结合ForestDNM检测 de novo SNVs(自主研发)
Stage II
分析方法对比
验证率
100% 80%
60%
40% 20%
0%
传统过滤法 改进过滤法 ForestDNM A training data set
de
突变或从头突变;即父母 不具有但子代具有的遗传 变异; de novo突变包括de
novo突变又称为新生
有进化遗传理论认为de
变是人类的许多遗传性疾病的主 要原因。
novo突
novo SNVs; de novo Indels ; de novo CNVs。 de novo突变分为de novo体细胞突变,de novo胚系突变
表观基 因组 复杂疾
转录组
病
1) 疾病biomarker:以代谢物 为对象,研究药物对机体产生的影 响。e.g. 冠状动脉病变引起的心 梗,寻找心梗病发病阶段的 biomarker 2) 药物安全性评价:以代谢物为 对象,研究药物对机体产生的影响。 实验样品为易获得样品(如尿、血), 可连续多次获取,并在同一动物或 人体观察毒性作用发生、发展和恢 复过程;
背景
假说:即散发性疾病的遗传基
础可能不同于很多家族性个体。 因为前者更可能是由于de novo 突变而非遗传变异。
罕见疾病de novo 突变研究
Gene SETBP1 MLL2 ASXL1 ANKRD11 AKT1(为体细胞 突变) ACTB/ACTG1 SWI/SNF
Disorder Schinzel-Giedion syndrome (mental retardation and neurodegeneration). Kabuki syndrome (intellectual disability and congenital anomalies). Borhing-Opitz syndrome (severe intellectual disability and congenital malformations. KBG syndrome (facial/skeletal malformations and developmental delay). Proteus syndrome (skin overgrowth and atypical bone development). Baraitser-Winter syndrome (brain malformation). Coffin–Siris syndrome.
Publication NG NG NG AJHG NEJM NG NG
Time 2010 2010 2011 2011 2011 2012 2012
国际上精神类疾病de novo 突变研究进展
paper 时间 2010 杂志 PNAS 研究疾病 精神分裂症 方法 185个trios,SHANK3 基因的编码区直接测序, 285个家系外正常样本验 证。 10个trios, 外显子测序研 究 14个患者及父母,外显 子测序 主要结果 两个家系的两个de novo突变同 SCZ相关
2005
全基因组重测序(NGS-GWAS) (108 SNPs / 1012 genotypes)
GWAS策略大大加速了疾病研究
第一篇GWAS的文章发表于2005年; 截至2013年8月共发表文章1688篇;
报道了约11299个关联性位点;
涉及超过200种的疾病或性状。
GWAS面临的挑战
复杂疾病de novo 突变研究-研究背景
每代每个基因组~50100 个de novo SNVs, ~3 个de novo indels 以及 ~0.02个 de novo CNVs; 每代每个外显子组~1 个 de novo 突变;
de novo
突变定义
de novo
突变率
de novo
突变影响
发现的GWAS SNPs仅4.9%位于 coding区域
绝大多数 Noncoding区域内的GWAS SNPs可能 与调控相关
Science. 2012 Sep 7;337(6099):1190-5.
Encyclopedia of DNA Elements(DNA元素百科全书) 美国国立人类基因组研究所(National Human Genome Research Institute,NHGRI)在2003年9月启动,由来自美国,英国,西班 牙,日本和新加坡32个科研机构,442科学家共同完成。
基于组学的复杂疾病研究
徐煜,BGI-tech xuyu@ Oct,2013
遗传和环境相互作用导致疾病
复杂疾病研究的角度及解决的问题
1) GWAS易感基因研究…
基因组
1) 表观修饰与疾病的关系, 寻找致病原因或与药物靶 点相关的信息 2) 环境与疾病关系 e.g. 药物疗效研究、 EWAS、伦敦国王学院 5000对双胞胎 1) 疾病biomarker研究: 寻找差异表达的RNA,进 行功能分析(蛋白功能、调 控作用) 2) 研究基因相互作用,构 建基因调控网络:eQTL 存在问题:组织特异性和时 空特异性