当前位置:文档之家› 疾病基因克隆的策略及主要方法

疾病基因克隆的策略及主要方法

疾病基因克隆的策略及主要方法申海鹰周元国(第三军医大学野战外科研究所分子生物学中心,重庆400042)摘要疾病基因的分离和克隆是功能基因组学的研究热点,具体策略的选择取决于疾病背景资料的掌握程度,为能快速、准确地克隆出目的基因,本文介绍两类常用的基因克隆策略——定位克隆策略、功能克隆策略——及其主要方法,如:家系连锁分析、等位基因共占法、人群相关分析法、抑制性消减杂交、差示反转录PCR、差异消减显示法、代表性差异分析法、比较基因组杂交等,并作简要的评价。

关键词基因;定位克隆;消减杂交学科分类号Q785Strategies and methods for cloning pathogenic gene SHEN Hai-ying, ZHOU Yuan-guo. (C enter of Molecular Biology, Research Institute of Surgery and Daping Hospital, Third Milit ary Medical University, Chongqing 400042)Abstract Isolation and cloning of pathogenic gene is a hot spot in functional genome stu dy, while it is the disease background which decides the selection of the strategies. Tw o strategies, mapping strategy and functional cloning strategy, which can clone the obje ctive gene rapidly and accurately were introduced. Some main methods including family-based linkage analysis, allele sharing method, population association analysis, suppressio n subtractive hybridization (SSH), differential display reverse-transcription PCR (DD-RT-PC R), differential subtraction display (DSD), representational difference analysis (RDA), com parative genome hybridization (CEH) were elucidated briefly.Key words: Gene; Mapping clone; Subtractive hybridization基因组全序列测定可望提前完成,而以功能鉴定为中心的功能基因组学应运而生,将人类5~10万个基因定位及克隆是一项庞大而艰巨的任务。

自1911年Wilson将色盲基因定位于X染色体起,随着连锁分析方法的发展和体细胞杂交、重组DNA、分子杂交以及PCR技术的发现和应用,陆续出现了几种改进或全新的遗传学基因定位和克隆方法。

与此同时,另一类以消减杂交为基本原理的代表性差异分析、基因组错配扫描、比较基因组杂交及mRNA差示等方法的出现和应用,使一些多基因遗传病相关致病基因的筛查和定位面临突破。

迄今为止,约有5000个遗传性状被定位,其中400多个为致病基因[1]。

根据不同的背景资料,人类基因克隆可采取的思路有以下四种(见附图):目前人类基因克隆的主要策略有三种:一是反向遗传学定位克隆策略,它通过RFLP、微卫星D NA等遗传标记,先获得某一表型基因在染色体上的定位,再在候选区域内选择已知基因,进行致病突变的筛选,并获得cDNA及全基因;另一类是从蛋白质功能着手的功能克隆策略,采用以消减杂交为策略的多种分子生物学手段,先通过消减获得特异表达或缺失的基因片段,然后进行染色体定位乃至获得全基因。

本文拟就前两种主要策略和各自方法的优缺点作一介绍和分析。

此外,尚有介于两者之间的候选克隆策略,包括定位候选克隆和功能候选克隆,前者是在将疾病基因以连锁分析和染色体分析基本定位以后,再在候选区域内选择所有已知基因进行致病突变的筛选。

后者是根据致病基因的可能功能,检测Genbank中的基因功能区域,将含有接近功能域的基因用于致病的突变检测。

1. 定位克隆(positional cloning)策略其基本思路是通过连锁分析(linkage analysis)原理进行基因定位。

若多态标记与待定基因距离较远,则它们在向子代传递时会发生自由分离,呈“连锁平衡”;反之,则不发生自由分离,而呈现“共分离(co segregation)”现象,即“连锁不平衡”。

据此可在染色体上定位与某一DNA标记相连锁的基因。

两基因间连锁程度以遗传距离表示:1厘摩(cM)=1%重组率,即1000kb。

D NA标记的选择经历了从致病基因→ABO、HLA多态位点→RFLP→微卫星DNA的发展过程。

微卫星DNA(microsatellite DNA),是一种遍布于真核基因组的短重复序列、长度2~10bp之间、按孟德尔方式遗传、呈高度多态,能进行PCR扩增。

除DNA标记的进展外,基因定位也得益于连锁分析方法和理论的改进,目前主要有:家系连锁分析、等位基因共占法及人群相关性分析等。

1.1家系连锁分析(family-based linkage analysis)法是以二代或二代以上的家系材料为基础,观察标记位点与疾病致病基因位点在家系内是否呈共分离,并计算出遗传距离及连锁程度。

目前最常用的方法是优势对数计分(Lods)法,Lod值代表两位点连锁的机率与不呈连锁的机率比的对数值,>3肯定连锁,<-2否定连锁,介于1与-2之间则需增加家系材料。

该法优点在于对连锁的判断能力强,能确定连锁程度,适于呈孟德尔遗传、外显率高、纯一的单基因突变病分析[2],如糖尿病中的一种亚型MODY及少数呈多代多发患者的IDDM及NIDDM家系。

缺点是需要完整的系谱材料,结果受遗传模型设定的影响,对遗传参数如基因频率、基因传递率、外显率及表型模拟率等依赖较大,故对一些复杂多基因疾病进行家系连锁分析很难获得满意结果[3]。

1.2等位基因共占(allele sharing method)法基于观察受累同胞或家系成员间标记位点等位基因的共占情况[4],即来源于同一祖先的致病基因由受累的亲属共占的机率大于随机分布的机率,包括受累同胞对(Affected sib pair, ASP)分析及家系成员(APM)分析。

在ASP中,当标记位点与疾病无连锁时,双亲的标记位点等位基因随机分配给子代;若存在连锁,则受累同胞间共有等位基因机率将高于连锁时的预期值。

A PM是ASP的延伸,通过观察家系内所有患病成员标记位点等位基因的共有情况,来提高每个家系的信息量。

原则上,若具备双亲样本材料,可据此判定受累同胞的相同等位基因片段是否同源,即传递一致性(identical-by-descent, IBD)分析;若无双亲资料,则只能通过同胞间等位基因比较来推测其是否共有,即状态一致性(identical-by-state, IBS)分析。

若双亲均为纯合子以致判断困难者,可经统计处理用最大拟然实验估测出最可能的传递情况[5]。

该法优点是:①不受遗传模式等遗传参数影响,为非参数分析法;②对系谱材料要求低,只需一代或二代的家系内患病成员资料,而不需非患病成员资料;③可进行定量性状研究[6];④可研究两个不相连锁位点对疾病的联合作用,以解决复杂病易感基因间的相互关系;⑤对遗传异质性容许度大;⑥在候选基因研究中可应用间距较远(~20cM)的标记,故特别适合多基因遗传病及参数情况多数未明的复杂病研究。

采用此法已发现在染色体6p24-22区域存在起很小效应的精神分裂症致病基因。

缺点在于:①对连锁的判别效能弱于家系连锁分析,不能确定连锁程度;②检出力低于相关分析;③若家系中双亲均为患者的机率较高时,因易感基因可由双亲传递给子代,会影响分析正确性。

1.3人群相关分析(association analysis)法原理是在一定人群中设置患者组和对照组,在可能的候选致病基因附近选择遗传标记,通过观察标记位点与致病基因位点间存在连锁不平衡现象,得到某一遗传标记和引起疾病基因关联的相对危险度,又称连锁不平衡定位(linkage disequilibrium mapping, LDM)法[7]。

显然,标记位点与致病基因越近,且突变率越低,杂合度越高,则用标记检测致病基因位点的机率越高。

L DM法假设在人群中某一致病基因起源于同一远祖,经过若干代的传递,那些与致病基因紧密连锁的基因或DNA标记被一起分配到不同的患病个体。

研究那些表面上无亲缘关系的患者是否有相同的DNA标记的等位基因,根据该DNA标记可以得到待研究基因在染色体上的定位。

LDM法适合在人口流动极小,相对同源的人群中进行。

该类人群遗传背景及环境相近,但患者间亲缘关系远(较家系分析而言),故其连锁不平衡作用大,此时定位基因所需遗传标记及研究的患者数较一般人群相关性分析少。

其优点有:①无亲缘关系患者样本容易随机采集,并完全符合群体中疾病的临床谱;②为非参数分析;③检出力高于家系连锁分析,在复杂病研究中不但可以检出主效基因,而且可以检出相对风险率小于5.0的次效基因;④检出的相关位点与致病突变的距离多在1cM以内,而家系连锁分析则为2~10cM;⑤可提示相关位点或基因的传递方式及效应性质(致病或保护作用),并可由亚组分析发现疾病的遗传异质性。

但相关分析亦有缺点:在种群组成差异的两组间,会因标记位点等位基因频率及易感基因频率差异导致假阳性结果,即群体分层(population stratificati on)现象。

对此,一些新的研究方法如:患者家系对照者分析(affected family-based control, AFBAC)、单倍型相对风险率分析(haplotype relative risk, HRR)以及倍受推崇的家系传递连锁不平衡检验(transmission disequilibrium test, TDT)得以应用。

TDT法是在家系内进行相关分析[8],观察双亲(至少一个为杂合子)是否有某种等位基因传递给患者的频率明显增高,而呈现连锁不平衡。

TDT有以下优点:①可完全消除种族分层引起的误差;②可用于分析父、母在基因传递上的差异,如遗传印记(imprinting)的影响;③可分析相关位点参与发病程度及基因间相互关系,TDT法的应用解决了胰岛素基因是否与IDDM相关的长期争论。

相关主题