DOI:10.3969/cmba.j.issn.1673-713X.2012.05.007 ·综述· 合成生物学的关键技术及应用进展邢玉华,谭俊杰,李玉霞,凌焱,刘刚,陈惠鹏20 世纪的生物学研究一直着眼于对生物系统的不断分解,解剖至细胞中单个蛋白或基因,研究其结构和功能来解释生命现象。
但随着当代分子生物学技术的迅猛发展,以系统化设计和工程化构建为理念的合成生物学成为新一代生物学的发展方向。
合成生物学旨在对多种天然的或人工设计的生物学元件进行合理而系统的组合以获得重构的或非天然的“生物系统”,其涵盖的研究内容可以大体分为 3 个层次:一是利用已知功能的天然生物模体(motif)或模块(module)构建成新型调控网络并表现出新功能;二是采用从头合成(de novo synthesis)的方法,人工合成基因组 DNA 并重构生命体;第三个层次则是在前两个研究领域得到充分发展之后,创建完整的全新生物系统乃至人工生命体(artificial life)。
合成生物学强调利用工程化的设计理念,实现从元件到模块再到系统的“自下而上”设计。
利用生物系统最底层的 DNA、RNA、蛋白质等作为设计的元件,利用转录调控、代谢调控等生物功能将这些底层元件关联起来形成生物模块,再将这些模块连接成系统,实现所需的功能。
这是一门涉及微生物学、分子生物学、系统生物学、遗传工程、材料科学以及计算科学等多个领域的综合性交叉学科。
它有别于传统的基因工程,其目的在于组装各种生命元件来建立人工生物体系,让它们能像电路一样在生物体内运行,使生物体能按预想的方式完成各种生物学功能。
合成生物学的最高境界是灵活设计和改造生命,重塑生命体。
本文就目前合成生物学采用的关键技术和研究应用进展两方面进行综述。
1 基因组的人工合成技术2010 年 5 月 20 日,Science报道了 Venter 研究组采用化学方法合成了一个 1.08 Mb 的蕈状支原体基因组,并将其移植入一个山羊支原体受体细胞,从而创造了一个仅由合成基因组控制的新的蕈状支原体细胞[1]。
这项成果在合成生物学的发展史中具有里程碑的意义。
在此之前,也有许多基因组合成的成功报道。
2002 年,纽约州立大学 Wimmer 实验室合成了脊髓灰质炎病毒,这是人类历史上第一个人工合成的病毒。
多年来,Venter 等一直致力于合成基因组的研究。
2003 年,合成了长达 5386 bp 的ΦX174 噬菌体基因组,实现了用寡核苷酸合成的方法精确合成了 5 ~ 6 kb 的 DNA 序列;2008 年,Venter 实验室又合成了生殖支原体基因组,该基因组全长 582970 bp,是已知的生物体中独立生存的最小基因组[2];2010 年 10 月他们又发明了迄今最简单有效的基因合成技术,并以此合成了实验小鼠的线粒体基因组[3]。
Dymond 等[4]的研究更进了一步,他们于 2011 年报道成功设计合成了酿酒酵母的部分染色体,这是酿酒酵母基因组人工合成计划(SC2.0 Project)取得的第一个成果,该项目的最终目标是人工合成构建酿酒酵母基因组。
酵母基因组人工合成将是合成生物学发展史上又一重要的里程碑。
DNA 合成是支撑合成生物学发展的核心技术,它不依赖于 DNA 模板,可根据已知的 DNA 序列直接合成,在基因及生物元件的合成、基因回路和生物合成途径的重新设计组装,以及全基因组的人工合成中发挥重大作用。
由于化学合成的 DNA 片段长度有限,要合成长的 DNA 片段需要先合成短的寡核苷酸,然后再将寡核苷酸进行拼接。
因此,基因组合成的基本思路为:①按照原始基因组序列设计合成寡核苷酸;②利用各种方法将寡核苷酸拼接成较长的 DNA 序列;③以较长的序列为基础,进一步拼接得到更长的DNA 序列,拼接成完整的基因组;④将合成的基因组移植到细胞中,并验证其功能。
1.1 寡核苷酸的合成目前寡核苷酸一般采用固相亚磷酰胺三酯法合成。
寡核苷酸的长度是一个重要的参数,随着长度的延长,产率下降,纯度也降低,积累的合成错误大大增加。
较短的寡核苷酸会有较少的错误,但是需要增加组装所需的重叠序列,使合成成本增加。
使用 60-mer 的寡核苷酸,可以最大程度地降低错配率和生产成本[5]。
1.2 由寡核苷酸拼接成较长的 DNA 片段寡核苷酸可以通过各种方法拼接成几百 bp 到几千 bp 的 DNA 片段。
常用的体外拼接方法有以下两种:连接酶链式反应(ligase chain reaction,LCR)和快速聚合酶链式组装法(polymerase chain assembly,PCA)。
LCR 法利用 Taq 连接酶将首尾相连、重叠杂交的寡核苷酸片段连接起来,连接反应在较高温度下进行,因而可以排除 DNA 二级结构的干扰;但是基因合成的成本大大增加。
PCA 法是两条具有部分重叠的寡核苷酸互为引物互为模板进行聚合酶的延伸,延伸得到的序列再通过与其他寡核苷酸退火、延伸,进行多次循环后,最终合成目的序列。
PCA 法合成成本较连接酶法大大降低。
这种方法逐渐得到广泛使基金项目:国家高技术研究发展计划(863 计划)子课题(2012AA 022001-03D)作者单位:100071 北京,军事医学科学院生物工程研究所(邢玉华、谭俊杰、李玉霞、凌焱、刘刚、陈惠鹏);130012 长春,吉林大学生命科学学院(邢玉华)通讯作者:刘刚,Email:jueliu@收稿日期:2012-07-16用,并且衍生出一系列的 DNA拼接方法,包括 TBIO 法(thermodynamically balanced inside-out)、双重不对称 PCR (dual asymmetric PCR)、重叠延伸 PCR(overlap extension PCR,OE-PCR)[6]和连续 PCR 等。
此外,Venter 小组报道将两端带有重叠序列的寡核苷酸片段和载体转入酵母细胞中,利用酵母体内的同源重组可以拼接起来并克隆到载体上,可以实现 38 个寡核苷酸片段同时拼接[7]。
1.3 DNA 大片段和基因组的组装利用 LCR 和 PCA 法一般可将寡核苷酸拼接成几千bp 以下的基因序列。
更长的大片段和基因组 DNA 则需要进一步拼接。
常用的拼接方法有以下几种:1.3.1利用限制性内切酶和连接酶的连接这是最简单的方法,通过连接将片段连成全长。
但是当进行多个 DNA 片段连接时,往往很难找到合适的酶切位点,而且连接片段会有几个碱基的残留,因此该方法在多个 DNA 片段连接时有很大的局限性。
合成生物学中的 Biobrick 连接法巧妙地设计了 4 个限制性内切酶,通过酶切连接可以将 DNA 片段拼接起来[8]。
还有一种筛选连接法(ligation by selection,LBS),使用 IIs 型限制性内切酶Bsa I 和Bbs I,并通过抗性筛选实现无痕拼接。
Kodumal 等[9]利用这种方法最终组装成了 32 kb 长的聚酮合酶基因簇。
1.3.2 基于重叠序列和聚合酶延伸的方法包括重叠延伸PCR(OE-PCR)法和环形聚合酶延伸法(circular polymerase extension cloning,CPEC)。
OE-PCR 法是相邻的具有重叠序列的 DNA 片段变性退火后形成互补双链,通过 DNA聚合酶进行延伸,再利用末端引物将其扩增出来。
该方法方便有效,但依赖于聚合酶的高保真度,合成的大片段长度有限,约在 20 kb 以下。
CPEC 法原理与 OE-PCR 类似,但是不需要扩增引物,可将多个相互重叠的 DNA 片段与载体一步连接成完整的环状质粒,然后直接转化细胞,在体内进行扩增。
1.3.3 不依赖于基因序列和连接反应的克隆方法[10] 利用T4 DNA 聚合酶在无 dNTPs 的情况下发挥的 3' ~ 5' 外切酶活性,能将 DNA 片段消化产生含有同源序列的5'-ssDNA 突出端(15 ~ 30 个碱基),DNA 片段之间及DNA 与载体依靠同源序列退火,形成环状中间体,直接转化细胞,利用大肠杆菌本身的修复系统修复成完整的环状质粒。
这种克隆方法不需要连接酶,也不需要考虑插入片段的序列,可实现多个 DNA 片段的一次性连接重组,用途非常广泛。
国外公司已经开始将其用于商业,比如 Novagen 公司的 Radiance TM系统及 Invitrogen 公司 Gateway TM 系统都是基于此技术的原理开发的。
Schmid-Burgk 等[11]对不依赖于基因序列和连接反应的克隆方法(sequence and ligation- independent cloning, SLIC)进行了改进,设计一段特殊序列,但是这种方法会在连接序列中引入多余的碱基,适用于基因之间的拼接,可用于合成生物学中基因回路的构建及生物途径的组装。
1.3.4 Gibson 等温一步拼接法该法是 SLIC 法的延伸。
选用核酸外切酶、DNA 聚合酶和 DNA 连接酶 3 种酶进行拼接。
相邻的具有重叠序列的片段,加入上述 3 种酶和dNTPs 共同孵育。
核酸外切酶能从5′降解核苷酸,且不与DNA 聚合酶竞争。
双链 DNA 被消化产生突出的单链DNA,重叠序列特异性退火,此时,外切酶逐渐热失活。
DNA 聚合酶和 DNA 连接酶修复连接成完整的双链 DNA 分子,从而实现无痕拼接。
Gibson 等[12]利用此方法成功地将 4 个大于 100 kb 的片段在体外组装成完整的 583 kb 的生殖支原体基因组。
此外,他们还尝试将 600 个长60-mers 的寡核苷酸(寡核苷酸之间带有 20 个重叠序列)成功地合成了小鼠的线粒体基因组(16.3 kb)。
这种方法方便、快速、高效,能组装长达 900 kb 的 DNA 大片段,而且出错率会大大降低。
体外重组拼接一般选用细菌人工染色体(BAC)为载体,但是当 DNA 片段达到一定长度时(约300 kb),BAC 在大肠杆菌中不稳定,达到转化的极限,更大的片段需要在微生物体内进行重组。
1.3.5 酵母体内同源重组拼接法利用酵母细胞内高效的同源重组系统来实现多个相互存在同源序列的 DNA 片段的组装。
V enter 研究组在 2008 年的Mycoplasma genitalium JCVI-1.0(582970 bp)基因组合成中最后一步拼接就是在酿酒酵母中完成的[2]。
虽然利用体外重组系统可以组装成完整的基因组,但是 BAC 载体在大肠杆菌内不稳定,为此他们建立了转化介导的重组克隆方法(transformation-associated recombination,TAR),利用酵母人工染色体(YAC)能大大提高稳定性及 TAR 克隆效率。