人类后基因组计划及研究进展
摘要:2003年4月14日生命科学诞生了一个新的重要里程碑,人类基因组计划完成,后基因组时代正式来临。
着重介绍了人类基因组计划的提出、目标与任务、实施与进展等方面的基本情况,讨论了后基因组时代的时间界定,分析展望了后基因组时代与人类基因组计划密切相关的生物信息学、功能基因组学、蛋白质组学、药物基因组学等几个重要研究领域。
关键词:人类基因组计划;研究进展
2003年4月14日,美国人类基因组研究项目首席科学家Collins F博士在华盛顿隆重宣布:人类基因组序列图绘制成功,人类基因组计划(human genome project,HGP)的所有目标全部实现。
这标志“人类基因组计划”胜利完成和“后基因组时代”(post genome em,PGE)正式来l临,在举世庆祝“DNA双螺旋结构”提出50周年之际,生命科学诞生了一个新的里程碑。
HGP被誉为可与“曼哈顿原子弹计划”、“阿波罗登月计划”相媲美的伟大系统工程,是人类第一次系统、全面地解读和研究人类遗传物质DNA的全球性合作计划。
人类基因组序列图的成功绘制是科学史上最伟大的成就之一,奠定了人类认识自我的重要基石,推动了生命与医学科学的革命性进展。
在后基因组时代,生命科学关注的范围越来越大,涉及的问题越来越复杂,采用的技术越来越高,取得的成就将越来越多,生命科学及其相关科学将大有作为。
1人类基因组计划的产生与目标
1984年12月,美国犹他大学的Wenter受美国能源部的委托,主持讨论了DNA重组技术及测定人类整个基因组DNA序列的意义.1985年6月,美国能源部提出“人类基因组计划”(Humangenome project,HGP)的初步草案.最早提出测定人类基因组序列的是美国科学家罗伯特·辛西默(Robert Sinshimer).1986年3月,美国的诺贝尔奖获得者雷纳多·杜尔贝柯石(Renato Dulbecco)在《科学》杂志上发表的短文中率先提出“测定人类的整个基因组序列”的主张[1],后经世界性的讨论取得共识.1987年,美国开始筹建“人类基因组计划”实验室.1988年,科学家开始讨论如何才能更快、更多、更好地研究与人类的生老病死有关的所有基因——全部的人类基因组.1989年,美国成立“国家人类基因组研究中心”,诺贝尔奖获得者、DNA分子双螺旋结构模型的提出者Jamse Wateson担任第一任主任.1990年10月,美国首先正式启动“人类基因组计划”(HGP),完成人类全部DNA分子核苷酸序列的测定.1993年,美国对这一计划做了修订,其中最重要的任务就是人类基因组的基因图构建与序列分析,需最优先考虑、必须保质保量完成的是DNA序列图.随后,英国、法国、日本、加拿大、前苏联、中国等许多国家积极响应,都开始了不同规模、各有特色
的人类基因组研究。
1999年12月1日,人类首次成功地完成人体染色体基因完整序列的测定.2000年6
月26日,六国科学家公布人类基因组工作框架图,成为人类基因组计划进展的一个重要里程碑.2001年2月12日,人类基因组图谱及初步分析结果首次公布.2003年4月15日,美、英、德、日、法、中6个国家共同宣布人类基因组序列图完成,人类基因组计划的所有目标全部实现,提前2年实现了目标。
2人类基因组计划的内容
从1987年提出“人类基因组计划”到1990年正式实施,研究的具体内容表现在4张图上:遗传图、物理图、序列图和转录图,其主要内容是绘制人类基因组序列框架图.1993年马里兰州Hunt,Valley会议上,经美国人类基因组研究中心(CHGR)修订后的HGP内容[4]包括:人类基因组作图及序列分析;基因的鉴定;基因组研究技术的建立、创新与改进;模式生物(主要包括大肠杆菌、酵母、果蝇、线虫、小鼠、水稻、拟南芥等)基因组的作图和测序;信息系统的建立,信息的储存、处理及相应的软件开发;与人类基因组相关的伦理学、法学和社会影响与结果的研究;研究人员的培训;技术转让及产业开发;研究计划的外延等几方面,这些内容构成了20世纪到21世纪最大的系统工程。
3基因组多样性的研究
人类是一个具有多态性的群体。
不同群体和个体在生物学性状以及在对疾病的易感性上的差别,反映了进化过程中基因组与内、外环境相互作用的结果。
开展人类基因组多样性的系统研究,无论对了解人类的起源、进化和迁徙,还是对生物医学,均会产生重大的影响。
已知人类基因组DNA序列中最常见的变异形式是SNP。
当SNP位于基因的编码序列中即称为eSNP。
eSNP引起蛋白质重要部位氨基酸的变异,可导致其功能改变;位于基因调控序列中的SNP则可能影响基因表达的剂量。
故这两种SNP的生物学意义更为显著,是基因组中决定人类表型多样性的核心信息。
另一方面,SNP因连锁不平衡(LD)所形成的单倍型,也可用于关联研究来确定与之连锁的生物学性状相关序列。
目前,已发展了多种自动化和批量化检测SNP的技术,其应用范围十分广泛,包括连锁分析与基因定位;疾病的关联研究;多基因疾病的基因定位;个体识别和亲子鉴定,发病机理的研究;以及研究生物进化,生物间相互关系等。
从1999年起,国际上10家大药厂与三家研究机构建立的SNP协作组,及数家信息技术产业大公司,对24个来自世界不同群体的个体,进行SNP的随机筛选,2001年获得30万个SNP,其中半数得到定位,从而将整个基因组分隔为5—50Kb长度的LD片段。
目前,该计划进展顺利,所发现的SNP在人群中测试的成功率为94%,已有41,200个SNP向公共领域公布。
4、HGP实施与进展
4.1 研究策略
人类基因组全序列分析分两大步骤:即制图(mapping)和测序(sequencinE),全过程
分为4个阶段(可交叉进行):(1)构建1cM的遗传图;(2)构建物理图;(3)建立重叠克隆系;
(4)完成核苷酸顺序测定。
HGP最终将绘制出4张图谱,即得到遗传图谱、物理图谱、序列图谱和转录图谱,从分子水平上揭示出人体的奥秘。
HGP在制图的基础上测序,最后获得4张图谱,核心是获得高质量的基因组序列图。
首先力争获得覆盖人类全基因组序列90%、精确率为95%的“工作草图”;在此基础上.查漏补缺,获得覆盖率99%、精确率99.99%的“精细图”;最后获得覆盖率100%、精确率99.99%的“完成图”。
4.2研究进展
1987年,美国马萨诸塞人类基因合作组的研究人员以限制性片段多态性(RFLP)为遗传标志绘制了第一代人类遗传图谱,为HGP基因组作图奠定了基础。
1992年.法国Genethon 实验室绘制出以STR为遗传标志的第二代人类遗传图谱。
并于1994年得到更加完善的
遗传图谱(提前1年完成人类遗传图谱的绘制目标),1996年得到完整的人类基因组遗传图
谱。
2000年,美国Whitehead InstitutelMIT中心得到以SNP为遗传标志的第三代人类基因组遗传图谱。
2000年4月13日,美国JGI中心完成第5、第16和第19号染色体的遗传密码草图;2000年5月,德、日两国共同破译了人类第2l号染色体基因全序列”“;2000年6月26日,国际人类基因组测序联盟与Celera公司联合发布了“人类基因组工作草图”(work draft);2001年2月12日又分别在Nature和Science杂志上公布了人类基因组“精确图”(准确度达到99.99%)及初步分析结果。
两组数据存在一定差异,但大部分高度吻合,发现人类基因数目约为3.4万至3.5万个(仅比果蝇多2万个,远小于原来估计的10万个基因);2003年4月14日Collins F博士在华盛顿隆重宣布HGP完成,得到了人类基因组“完成图”(包括99%的人类基因组序列.准确度为99.99%)。
迄今为止,Nature杂志发表了6条(7、14、20、21、22和Y)染色体序列的完成情况及基本信息,其余染色体将陆续发表。
中国作为HGP第六个成员国(唯一的发展中国家)于1999年10月1日正式启动HGP,2000年4月,完成了1%人类基因组“工作框架图”;2001年8月26日绘制完成“中国卷”,提前2年获得精确度达99.99%的“完成图”序列。
所有BAC序列都经过指纹图谱的验证,共测定31.6 Mb的序列,识别122个基因,其中86个是已知基因(55个为功能明确的基因,8个为疾病相关基因),在31个基因中找到了75种不同的剪切方式,发现了1760个新的SNP,分析了“完成图”中重复序列、CpG岛和Gc含量。
除四张图谱以外,HGP在生物信息科学、数据处理、知识产权及社会伦理学研究、特别是基因专利申请、基因诊断、基因治疗对保险、就业影响等多方面都取得了较大的进展。
参考文献
3.骆建新;郑崛村;马用信人类基因组计划与后基因组时代[期刊论文]-中国生物工程杂志2003(11)
4.丁立;刘国仰;杨焕明人类基因组计划中的外显子捕获技术[期刊论文]-遗传1998
9.陈竺;黄薇;傅刚人类基因组计划现状与展望[期刊论文]-自然杂志2000(03)
10.刘万清;贺林自动化大规模基因组扫描与连锁分析1998(05)
11.范玉新;李霞基因功能分析与鉴定的新进展1998(03)
1. 刘威.LIU Wei 人类基因组计划大事记[期刊论文]-生物化学与生物物理进展2001,28(2)
2. 李娜.LI Na 人类基因组计划十年反思[期刊论文]-科技导报2010,28(13)
3. 中国科学院遗传所人类基因研究中心 "人类基因组计划”及其意义--规模化、序列化、信息化与产业化、医学
化、人文化[期刊论文]-自然辩证法研究2000,16(9)
4. 唐玉红人类基因组计划的价值伦理分析及对策[学位论文]2006。