当前位置:
文档之家› 全基因组从头测序(de novo测序)
全基因组从头测序(de novo测序)
[2] Li RQ, Fan W, Tian G, Zhu HM, He L, Cai J, et al. The sequence and de novo assembly of the giant panda genome. Nature. 2009 463, 311-317.
[3] Junjie Qin, Yujun Cui, et al. Open-Source Genomic Analysis of Shiga-Toxin–Producing E. coli O104:H4. N Engl J Med. 2011 Aug 25; 365(8): 718-24.
从头测序(de novo 测序)
从头测序即 de novo 测序,不需要任何参考序列资料即可对某个物种进行测序,用生物信息学分 析方法进行拼接、组装,从而获得该物种的基因组序列图谱。利用全基因组从头测序技术,可以获得 动物、植物、细菌、真菌的全基因组序列,从而推进该物种的研究。一个物种基因组序列图谱的完成, 意味着这个物种学科和产业的新开端!这也将带动这个物种下游一系列研究的开展。全基因组序列图 谱完成后,可以构建该物种的基因组数据库,为该物种的后基因组学研究搭建一个高效的平台;为后 续的基因挖掘、功能验证提供 DNA 序列信息。华大科技利用新一代高通量测序技术,可以高效、低 成本地完成所有物种的基因组序列图谱。
Medicine,NEJM)上在线发表。德国致病性大肠杆菌研究项目首次展示了快速的基因组测序
技术和及时的数据共享给全球各科研领域所带来的巨大贡献,证实了信息数据的快速共享在
公共卫生事件中可发挥至关重要的作用,同时也为应对全球重大突发性紧急公共卫生事件提
供了一个全新的解决思路。
德国肠出血性大肠杆菌项目进展时间轴
测序分析结果表明,大熊猫不喜欢吃肉主要是因为 T1R1 基因失活,无法感觉到肉的鲜
味。大熊猫基因组仍然具备很高的杂合率,从而推断具有较高的遗传多态性,不会濒于灭绝。
研究人员全面掌握了大熊猫的基因资源,对其在分子水平上的保护具有重要意义。
黄瓜基因组图谱 黄三文, 李瑞强, 王俊等. Nature Genetics. 2009.
熊猫基因组图谱 Nature. 2010.463:311-317.
案例描述
大熊猫有 21 对染色体,基因组大小 2.4 Gb,重复序列含量 36%,基因 2 万多个。熊猫
基因组图谱是世界上第一个完全采用新一代测序技术完成的基因组图谱,样品取自北京奥运
会吉祥物大熊猫“晶晶”。
部分研究成果
案例描述
国际黄瓜基因组计划是由中国农业科学院蔬菜花卉研究所于 2007 年初发起并组织,并
由深圳华大基因研究院承担基因组测序和组装等技术工作。
部分研究成果
黄瓜基因组是世界上第一个蔬菜作物的基因组图谱。该项目首次将传统的 Sanger 测序
和新一代测序技术相结合,对黄瓜进行全基因组测序。研究人员自主开发了一套全新的序列
德国肠出血性大肠杆菌 E. coli O104:H4 TY2482 基因组
大草莺球壳菌基因组. Genome Res. 2011 Dec; 21(12):2157-66.
案例描述
大草莺球壳菌(M.graminicola)是一种引起小麦 Triticum aestivum(T.a.)叶枯的真菌病原,
也感染披碱草 Elymus repens(E.r.),果园草 Dactylis glomerata(D.g.),多花黑麦草 Lolium
multiflorum(L.m.)以及多年生黑麦草 Lolium perenne(L.p.)。
部分研究成果
通过对 4 种病原菌:大草莺球壳菌-M.graminicola、2 种大草莺球壳菌的祖先菌株 S1 和
运转周期为 1 年
真菌
Survey 的标准流程运转 框架图标准流程运转周 Survey 升级到精细图标
周期约为 40 个工作日 期约为 50 个工作日
准流程(测序,信息分
析)运转周期约为 100
个工作日
细菌
Survey 组装标准流程运 精细图标准流程运转周 完成图标准流程运转周
转周期约为 40 个工作日 期约为 60 个工作日
期约为 75 个工作日
三 项目合格指标 1. 动植物基因组指标
基因组大小(Genome Size, GS) GS ≤ 300 Mb
300 Mb < GS ≤ 1500 Mb(鸟类除外)
1500 Mb < GS ≤ 3000 Mb (哺乳动物除外)
组装指标 Contig N50 > 20 kb Scaffold N50 > 300 kb Contig N50 > 10 kb Scaffold N50 > 150 kb Contig N50 > 20 kb Scaffold N50 > 300 kb Contig N50 > 10 kb Scaffold N50 > 150 kb Contig N50 > 10 kb Scaffold N50 > 150 kb
Survey
整体测序覆盖深度不低于 100 倍覆盖度。
细菌
精细图
基因组常染色质区覆盖度达到 95%以上,基因区覆盖度达到 98%以上(需 要提供高度同源序列);整体测序覆盖深度不低于 100 倍覆盖度; 精细图 v1.0 正常 GC 菌(35%≤GC%≤65%),基因组≤5 M, scaffold < 100;5 M ≤基因组 ≤ 10 M, scaffold 非正常 GC 菌(65%),基因组≤5 M, scaffold < 200,5 M ≤基因组≤ 10 M, scaffold 精细图 v2.0 正常 GC 菌(35%≤GC%≤65%),基因组≤5 M, contig < 100;5 M ≤基因组≤ 10 M,contig 非正常 GC 菌(65%),基因组≤5 M, contig < 200;5 M ≤基因组≤ 10 M, contig
完成图
经过基因组检测、1 个 scaffold、1 个 contig 这三个阶段,后期经过 2 轮 PCR 对完成图组装结果进行局部验证。
小基因组
Survey
整体测序覆盖深度不低于 100 ≥133ng/μl; 样品质量:基因组完整; 样品纯度:OD260/280= 1.8~2.0。
二、 项目执行周期 动植物
Survey 的标准流程运转 普通基因组标准流程的 复杂基因组标准流程的
周期约为 2 个月
运转周期为 6 个月
(2)病原菌在宿主环境中的正向选择影响编码分泌蛋白的基因,并且与宿主分子相互作用, 类似于一场病原与宿主协同进化的竞赛。
参考文献
[1] Sanwen Huang, Ruiqiang Li, Jun Wang, et al. The genome of The cucumber (Cucumis sativus Linnaeus). Nature Genetics. 2009.
[4] Li R, Wang J, et al. The making of a new pathogen: Insights from comparative population genomics of the domesticated wheat pathogen Mycosphaerella graminicola and its wild sister species. Genome Res. 2011 Dec; 21(12):2157-66.
复杂基因组 2. 微生物基因组指标
Survey
Contig N50 > 20 kb Scaffold N50 > 300 kb 整体测序覆盖深度不低于 30 倍覆盖度。
真菌
框架图
交付数据不低于 50× clean data。
精细图
基因组常染色质区覆盖度达到 95%以上,基因区覆盖度达到 98%以上(需 要提供高度同源序列),拼接片段 Scaffold N50 长度达到 300 Kb;整体测 序覆盖深度不低于 50 倍覆盖度。
技术流程:
技术参数:
一、 样本要求 样品类型:DNA 样 30 μg;总样品量需根据实 验策略,如建库类型及建库数量而定;
S2 以及球壳菌的远源菌——大麦斑枯病菌-Septoria passerinii 的基因组进行测序、组装及群体
基因组分析,得出以下结论:
(1)M. graminicola 对小麦的毒性最高,而且还保留对其他宿主的致病能力。M. graminicola 比祖先菌株 S1、S2 的适应进化能力更强;
Contig N50 > 5 kb Scaffold N50 > 20 kb
GS < 1600 Mb(鸟类 )
Contig N50 > 20 kb Scaffold N50 > 300 kb
GS < 3200 Mb (哺乳类,除翼手目除外)
Contig N50 > 20 kb Scaffold N50 > 300 kb
案例描述
2011 年 5 月-6 月德国爆发由 E.coli O104:H4 引起的急性肠出血性流行病疫情,疫情迅速
Байду номын сангаас
蔓延至欧洲及北美等地区,超过 4000 人被感染。此次疫情中,华大基因研究院和德国汉堡—
埃普多夫大学医学中心的研究人员以最快速度完成对致病菌基因组测序及分析,并即时向全
球免费公开所有数据,该数据库的公开使得整个科学界在第一时间共享了相关数据信息,为
拼接软件,成功绘制了黄瓜基因组图谱,这是国际黄瓜基因组计划第一阶段所取得的重大成
果,对黄瓜和其它瓜类作物的遗传改良、基础生物学研究、以及对植物维管束系统的功能和
进化研究将发挥重要的推动作用。