HEREDITAS (Beijing) 2011年8月, 33(8): 857―869 ISSN 0253-9772 综 述收稿日期: 2011−04−07; 修回日期: 2011−06−03基金项目:国家自然科学基金项目(编号: 30890034, 31000552), 教育部新世纪优秀人才支持计划项目(编号: NCET-09-0322)和上海市浦江人才计划项目(编号: 10PJ1400300)资助作者简介:杜仁骞, 在读博士研究生, 研究方向: 基因组拷贝数变异。
E-mail: renqian.du@通讯作者:张锋, 博士, 副教授, 博士生导师, 研究方向: 人类遗传学和医学遗传学。
E-mail: feng.fudan@DOI: 10.3724/SP.J.1005.2011.00857基因组拷贝数变异及其突变机理与人类疾病杜仁骞1,2, 金力1,2,3, 张锋1,21. 复旦大学生命科学学院现代人类学教育部重点实验室, 上海200433;2. 复旦大学生命科学学院遗传工程国家重点实验室, 上海200433;3. 复旦大学生物医学研究院, 上海200032摘要: 拷贝数变异(Copy number variation, CNV)是由基因组发生重排而导致的, 一般指长度为1 kb 以上的基因组大片段的拷贝数增加或者减少, 主要表现为亚显微水平的缺失和重复。
CNV 是基因组结构变异(Structural variation, SV)的重要组成部分。
CNV 位点的突变率远高于SNP(Single nucleotide polymorphism), 是人类疾病的重要致病因素之一。
目前, 用来进行全基因组范围的CNV 研究的方法有: 基于芯片的比较基因组杂交技术(array-based comparative genomic hybridization, aCGH)、SNP 分型芯片技术和新一代测序技术。
CNV 的形成机制有多种, 并可分为DNA 重组和DNA 错误复制两大类。
CNV 可以导致呈孟德尔遗传的单基因病与罕见疾病, 同时与复杂疾病也相关。
其致病的可能机制有基因剂量效应、基因断裂、基因融合和位置效应等。
对CNV 的深入研究, 可以使我们对人类基因组的构成、个体间的遗传差异、以及遗传致病因素有新的认识。
关键词: 拷贝数变异; 突变机理; 疾病; 人类基因组Copy number variations in the human genome: their mutational mechanisms and roles in diseasesDU Ren-Qian 1,2, JIN Li 1,2,3, ZHANG Feng 1,21. MOE Key Laboratory of Contemporary Anthropology , School of Life Sciences , Fudan University , Shanghai 200433, China ;2. State Key Laboratory of Genetic Engineering , School of Life Sciences , Fudan University , Shanghai 200433, China ;3. Institutes of Biomedical Sciences , Fudan University , Shanghai 200032, ChinaAbstract: Copy number variation (CNV) is the main type of structure variation (SV) caused by genomic rearrangement, which mainly includes deletion and duplication of sub-microscopic but large (>1 kb) genomic segments. CNV has been recognized as one of the main genetic factors underlying human diseases. The mutation rate (per locus) of CNV is much higher than that of single nucleotide polymorphism (SNP). The genome-wide assays for CNV study include array-based comparative genomic hybridization (aCGH), SNP genotyping microarrays, and next-generation sequencing techniques. Various molecular mechanisms are involved in CNV formation, which can be divided into two main categories, DNA re-combination-based and DNA replication-based mechanisms. CNVs can be associated with Mendelian diseases, sporadic diseases, and susceptibility to complex diseases. CNVs can convey clinical phenotypes by gene dosage, gene disruption, gene fusion, and position effects. Further studies on CNVs will shed new light on human genome structure, genetic varia-tions between individuals, and missing heritability of human diseases.Keywords: copy number variation; mutational mechanism; diseases; human genome858 HEREDITAS (Beijing) 2011 第33卷人类基因组上广泛存在着多种遗传变异形式与DNA 多态性。
单个核苷酸的变异早已被熟知, 其中那些频率大于1%的被称为单核苷酸多态性(Single nucleotide polymorphism, SNP)。
国际单倍体图谱计划(International HapMap Project)已经在人类群体中发现了数百万计的SNP(表1)[1]。
随着新的千人基因组计划(1000 Genomes Project)[2]对更多个体进行全基因组的序列测定, 还将有更多的SNP 被发现。
尽管一部分的SNP 被发现与人类疾病相关, 但只能解释疾病遗传因素中的一小部分, 仍有较多的未知遗传因素(Missing heritability)[3]没有被揭示。
除了DNA 的点突变, 基因组上还可以发生涉及大片段DNA 序列的变异, 包括亚显微结构(Sub-microscopic)的微重复(Microduplication)和微缺失(Microdeletion)[4]。
此类基因组片段的拷贝数变异(Copy number varia-tion, CNV)和SNP 类似, 除了一部分会致病以外, 也可以作为一种遗传多态性存在于人类及其他物种的基因组上[4~6]。
“拷贝数变异”, 顾名思义就是会产生拷贝数的量变; 除此以外, 基因组上也会发生涉及大片段DNA 、但不会改变DNA 片段拷贝数的变异, 例如倒位(Inversion)和平衡易位(Balanced trans-location)等。
此类不改变DNA 片段拷贝数的变异和CNV 一起被统称为基因组结构变异(Structural variation, SV)[7]。
表1 CNV 与SNP 的对比CNV SNP数量 a(NOV 02, 2010) b (Build 132) 大小 1 kb~3 Mb 绝大部分为1 bp 类型缺失、重复、 复杂变异 转换、颠换、 短缺失、短插入 作用方式 基因剂量、 基因失活等错义突变、无义突变、移码突变、 剪接位点突变基因组上的覆盖率 5%~10% <1%注:a参考了Database of Genomic Variants (http://projects.tcag.ca/variation/); b 参考了dbSNP (/SNP/)。
2004年是CNV 研究中具有里程碑意义的一年。
借助于能够覆盖整个人类基因组的新的研究技术, 有两个研究小组几乎同时发现了大片段的CNV 不仅可以导致出生缺陷等重大疾病, 还可以作为一种遗传多态性在人类基因组中广泛分布[8,9]。
随着基因组分析技术的继续进步, 已经有超过66 000个SV 被报道(表1), 其中主要是CNV 。
人类基因组上大量的CNV 是如何产生的?其中一类已知的机制是DNA 重组, 包括非等位同源重组(Nonallelic homologous recombination, NAHR)和非同源末端连接(Nonhomologous end-joining, NHEJ)等[10]。
最近, 一种新的基于DNA 错误复制的机制被发现, 即“复制叉停滞与模板交换”(Fork stalling and template switching, FoSTeS)模型。
此种机制可以解释那些不符合NAHR 、NHEJ 等突变机制的具有复杂结构的CNV [11,12]。
除了和人类罕见疾病以及单基因疾病相关, CNV 也与复杂疾病也相关, 比如对艾滋病病毒(HIV)、孤独症和精神分裂症的易感性[4~6]。
对CNV 这类遗传变异的研究, 或将可以促进对相关人类疾病的发病机制的认识, 指导疾病的分子诊断和新的治疗手段的开发。
1 CNV 和SV 的发现2004年, Sebat 等[9]使用ROMA(Representational oligonucleotide microarray analysis)技术, 应用85 000个平均间隔为35 kb 的探针分析了20个正常个体的基因组DNA 片段的拷贝数情况, 结果在76个位点上发现了221个大于100 kb 的CNV 。
同时, Iafrate 等[8]通过使用分辨率为1 Mb 的基于细菌人工染色体(Bacterial artificial chromosome, BAC)探针的比较基因组杂交芯片(array-based comparative ge-nomic hybridization, aCGH), 分析了55例个体的大片段CNV 情况, 鉴定了255个重复和缺失。