全基因组从头测序(de novo测序)/view/351686f19e3143323968936a.html从头测序即de novo 测序,不需要任何参考序列资料即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的基因组序列图谱。
利用全基因组从头测序技术,可以获得动物、植物、细菌、真菌的全基因组序列,从而推进该物种的研究。
一个物种基因组序列图谱的完成,意味着这个物种学科和产业的新开端!这也将带动这个物种下游一系列研究的开展。
全基因组序列图谱完成后,可以构建该物种的基因组数据库,为该物种的后基因组学研究搭建一个高效的平台;为后续的基因挖掘、功能验证提供DNA序列信息。
华大科技利用新一代高通量测序技术,可以高效、低成本地完成所有物种的基因组序列图谱。
包括研究内容、案例、技术流程、技术参数等,摘自深圳华大科技网站/service-solutions/ngs/genomics/de-novo-sequencing/技术优势:高通量测序:效率高,成本低;高深度测序:准确率高;全球领先的基因组组装软件:采用华大基因研究院自主研发的SOAPdenovo软件;经验丰富:华大科技已经成功完成上百个物种的全基因组从头测序。
研究内容: 基因组组装■K-mer分析以及基因组大小估计;■基因组杂合模拟(出现杂合时使用);■初步组装;■GC-Depth分布分析;■测序深度分析。
基因组注释■Repeat注释;■基因预测;■基因功能注释;■ncRNA注释。
动植物进化分析■基因家族鉴定(动物TreeFam;植物OrthoMCL);■物种系统发育树构建;■物种分歧时间估算(需要标定时间信息);■基因组共线性分析;■全基因组复制分析(动物WGAC;植物WGD)。
微生物高级分析■基因组圈图;■共线性分析;■基因家族分析;■CRISPR预测;■基因岛预测(毒力岛);■前噬菌体预测;■分泌蛋白预测。
熊猫基因组图谱Nature. 2010.463:311-317.案例描述大熊猫有21对染色体,基因组大小2.4 Gb,重复序列含量36%,基因2万多个。
熊猫基因组图谱是世界上第一个完全采用新一代测序技术完成的基因组图谱,样品取自北京奥运会吉祥物大熊猫“晶晶”。
部分研究成果测序分析结果表明,大熊猫不喜欢吃肉主要是因为T1R1基因失活,无法感觉到肉的鲜味。
大熊猫基因组仍然具备很高的杂合率,从而推断具有较高的遗传多态性,不会濒于灭绝。
研究人员全面掌握了大熊猫的基因资源,对其在分子水平上的保护具有重要意义。
黄瓜基因组图谱黄三文, 李瑞强, 王俊等. Nature Genetics. 2009.案例描述国际黄瓜基因组计划是由中国农业科学院蔬菜花卉研究所于2007年初发起并组织,并由深圳华大基因研究院承担基因组测序和组装等技术工作。
部分研究成果黄瓜基因组是世界上第一个蔬菜作物的基因组图谱。
该项目首次将传统的Sanger测序和新一代测序技术相结合,对黄瓜进行全基因组测序。
研究人员自主开发了一套全新的序列拼接软件,成功绘制了黄瓜基因组图谱,这是国际黄瓜基因组计划第一阶段所取得的重大成果,对黄瓜和其它瓜类作物的遗传改良、基础生物学研究、以及对植物维管束系统的功能和进化研究将发挥重要的推动作用。
德国致病性大肠杆菌完成图. N Engl J Med. 2011 Aug 25; 365(8): 718-24.案例描述2011年5月-6月德国爆发由E.coli O104:H4引起的急性肠出血性流行病疫情,疫情迅速蔓延至欧洲及北美等地区,超过4000人被感染。
此次疫情中,华大基因研究院和德国汉堡—埃普多夫大学医学中心的研究人员以最快速度完成对致病菌基因组测序及分析,并即时向全球免费公开所有数据,该数据库的公开使得整个科学界在第一时间共享了相关数据信息,为尽快控制疫情奠定了重要的科学基础。
部分研究成果年7月28日,由深圳华大基因研究院、德国汉堡—埃普多夫大学医学中心、中国疾病预防与控制中心和军事医学科学院微生物流行病研究所等单位主导完成的德国致病性大肠杆菌国际合作研究成果在国际著名杂志《新英格兰医学》(The New England Journal of Medicine,NEJM)上在线发表。
德国致病性大肠杆菌研究项目首次展示了快速的基因组测序技术和及时的数据共享给全球各科研领域所带来的巨大贡献,证实了信息数据的快速共享在公共卫生事件中可发挥至关重要的作用,同时也为应对全球重大突发性紧急公共卫生事件提供了一个全新的解决思路。
德国肠出血性大肠杆菌项目进展时间轴大草莺球壳菌基因组. Genome Res. 2011 Dec; 21(12):2157-66. 案例描述大草莺球壳菌(M.graminicola)是一种引起小麦Triticum aestivum(T.a.)叶枯的真菌病原,也感染披碱草Elymus repens(E.r.),果园草Dactylis glomerata(D.g.),多花黑麦草Lolium multiflorum(L.m.)以及多年生黑麦草Lolium perenne(L.p.)。
部分研究成果通过对4种病原菌:大草莺球壳菌-M.graminicola、2种大草莺球壳菌的祖先菌株S1和S2以及球壳菌的远源菌——大麦斑枯病菌-Septoria passerinii的基因组进行测序、组装及群体基因组分析,得出以下结论:(1)M. graminicola对小麦的毒性最高,而且还保留对其他宿主的致病能力。
M. graminicola比祖先菌株S1、S2的适应进化能力更强;(2)病原菌在宿主环境中的正向选择影响编码分泌蛋白的基因,并且与宿主分子相互作用,类似于一场病原与宿主协同进化的竞赛。
参考文献[1] Sanwen Huang, Ruiqiang Li, Jun Wang, et al. The genome of The cucumber (Cucumis sativus Linnaeus). Nature Genetics. 2009.J, et al. The sequence and de novo assembly of the giant panda genome. Nature. 2009 463, 311-317. jun Cui, et al. Open-Source Genomic Analysis of Shiga-Toxin–Producing E. coli O104:H4. N Engl J Med. 2011 Aug 25; 365(8): 718-Wang J, et al. The making of a new pathogen: Insights from comparative population genomics of the domesticated wheat pathogen Mycosphaerella graminicola and its wild sister species. Genome Res. 2011 Dec; 21(12):2157-66.技术流程:技术参数: 一、样本要求样品类型:DNA样品;样品需求量(单次):小片段文库≥3 μg;2 kb大片段文库≥20 μg;5kb-6kb大片段文库≥20 μg;10kb文库≥30μg ;20 kb和40kb大片段文库≥60 μg;PCR-free文库≥30 μg;总样品量需根据实验策略,如建库类型及建库数量而定;样品浓度:对于小片段文库≥30 ng/μl;对于对于大片段文库≥133ng/μl;样品质量:基因组完整;样品纯度:OD260/280= 1.8~2.0。
二、项目执行周期动植物 Survey的标准流程运转周期约为2个月普通基因组标准流程的运转周期为6个月复杂基因组标准流程的运转周期为1年真菌 Survey的标准流程运转周期约为40个工作日框架图标准流程运转周期约为50个工作日 Survey 升级到精细图标准流程(测序,信息分析)运转周期约为100个工作日细菌Survey组装标准流程运转周期约为40个工作日精细图标准流程运转周期约为60个工作日完成图标准流程运转周期约为75个工作日三项目合格指标1. 动植物基因组指标基因组大小(Genome Size, GS)组装指标GS ≤300 Mb Contig N50 >20 kb Scaffold N50 >300 kb Contig N50 >10 kb Scaffold N50 >150 kb 300 Mb <GS ≤1500 Mb(鸟类除外)Contig N50 >20 kb Scaffold N50 >300 kb Contig N50 >10 kb Scaffold N50 >150 kb 1500 Mb <GS ≤3000 Mb (哺乳动物除外)Contig N50 >10 kb Scaffold N50 >150 kb Contig N50 >5 kb Scaffold N50 >20 kbGS <1600 Mb(鸟类)Contig N50 >20 kb Scaffold N50 >300 kb GS <3200 Mb (哺乳类,除翼手目除外)Contig N50 >20 kb Scaffold N50 >300 kb 复杂基因组Contig N50 >20 kb Scaffold N50 >300 kb2. 微生物基因组指标真菌Survey 整体测序覆盖深度不低于30倍覆盖度。
框架图交付数据不低于50×clean data。
精细图基因组常染色质区覆盖度达到95%以上,基因区覆盖度达到98%以上(需要提供高度同源序列),拼接片段Scaffold N50长度达到300 Kb;整体测序覆盖深度不低于50倍覆盖度。
细菌Survey 整体测序覆盖深度不低于100倍覆盖度。
精细图基因组常染色质区覆盖度达到95%以上,基因区覆盖度达到98%以上(需要提供高度同源序列);整体测序覆盖深度不低于100倍覆盖度;精细图v1.0 正常GC菌(35%≤GC%≤65%),基因组≤5 M, scaffold < 100;5 M ≤基因组≤10 M, scaffold 非正常GC菌(65%),基因组≤5 M, scaffold < 200,5 M ≤基因组≤10 M,scaffold 精细图v2.0 正常GC菌(35%≤GC%≤65%),基因组≤5 M, contig < 100;5 M ≤基因组≤10 M,contig 非正常GC菌(65%),基因组≤5 M, contig < 200;5 M ≤基因组≤10 M,contig 完成图经过基因组检测、1个scaffold、1个contig这三个阶段,后期经过2轮PCR对完成图组装结果进行局部验证。