当前位置:文档之家› 翻译

翻译

衣藻的基因组揭示了关键的动物进化过程和一些植物的功能。

衣藻是一种十亿年以前谱系便与陆地植物不同的单细胞的绿色藻类生物。

这是一个了解叶绿体的光合作用,以及它的结构,装配,和真核鞭毛(纤毛)的功能的模型系统,这些是从动植物共同的祖先那里继承而来的,但陆生植物却没有。

我们测序的衣藻核基因组的120个碱基并进行了种系基因学的比较分析,确认基因编码未知功能的蛋白质可能与叶绿体或真核鞭毛的生命源和功能有关。

分析衣藻基因组促进了我们对祖先真核细胞的理解,揭示了先前未知的基因与光合作用和鞭毛的功能有关,并在ciliopathy.组成和鞭毛的功能之间建立了联系。

莱茵衣藻是一种大约~ 10um的居住在土壤中的单细胞绿色藻类,它有多个线粒体,以及两个位于前面的用于运动和交配的鞭毛,和一个为光合作用以及关键的代谢过程提供场所的叶绿体。

(图1和图S1)(1)。

衣藻是用来研究真核生物的光合作用,由于它不同于被子植物(开花的植物),它生长在黑暗中,依靠的是有机碳源,同时要有维持光合功能的器官(2)。

它也是一个阐明真核生物鞭毛作用,和他们基体的功能以由疾病引起的机理障碍的很好的模型(3,4)。

最近,衣藻也被探究用于生物修复和生物燃料发电(5,6)。

藻类与陆生植物在十亿年前便产生了偏差。

通过基因的对比,许多藻类基因可以追溯到绿色植物或动植物共同祖先。

具体地说,许多衣藻和被子植物的基因是来自祖先的绿色植物的基因,包括那些与光合作用和叶绿体功能有关的基因;这些也出现在ostreococcusspp(最小真核生物)和苔藓植物小立碗藓(图2)。

由衣藻和动物共享的来自过去动植物共同祖宗的基因在许多被子植物中已经消失了,特别是那些编码真核鞭毛(或纤毛)的蛋白质以及与基体(或中心粒)相关的基因。

通过调控基因来使它能够适应不同的复杂环境以及保证在养料供给起伏的状
况下能够存活下来,这显示出了衣藻具有广泛的代谢适应性。

基因组测序与组装。

基因组异常,GC含量丰富(64%)(表1),需要对标准测序报告进行修改。

衣藻核基因组的17个连锁群(figs,S2toS18)大概相当于17条染色体,与在电子显微镜下观察到的减数分裂联会复合体一致(11)。

代表基因组草图78%的七十四个支架材料已经与连锁群进行了校准。

通过测序与标准的实验室菌株交配过得的一株衣藻的Est片段,鉴定出了8775个基因多态性,得到了1每13 kb的标记密度。

通过比较生物基材的物理标记的位置与遗传重组的距离,我们估计的平均密度为100 kb的每cm。

衣藻基因组具有近似均匀密度的基因,简单并重复的序列,和转座子。

在大多数真核生物中,核糖体Rna (rRNA)基因是以串联的方式排列。

他们位于连锁群I,VII,和XV,虽然组件已经在最外层的复制中被制作完成了。

我们确定了259个转移RNA(tRNA)(1)(表
S1),61类简单的重复序列,~ 100种转座因子(1),和64个与tRNA有关的短的散布物质((表S2和S3),这是对于一个微生物来说是不寻常的。

我们还确定了tRNA 集群和最近的一些tRNA的重复(图19),以及基因簇与特定的生物功能相关。

少数几个叶绿体和线粒体基因组碎片会在核基因组中被检测到的。

蛋白质编码基因和结构。

基于对从一开始的基因的同源性的预测,结合EST的证据,被用来创建了一组有关15143个蛋白质编码基因的预测的参考,截至六月2007, 在不同的环境条件下产生了超过300000个ESt;8631基因模型(56%)的支持基因或EST的证据(14),和35%个已编辑的基因结构和/或注释手册策展。

平均而言,编码蛋白质的基因每个有大约8.3个外显子并且相对于其他单细胞真核生物和陆生植物来说内含子也是比较丰富的;(15)(图S21);只有8%缺少内含子(表1)。


藻内含子的平均长度(373 bp)比许多其他真核生物(16)要长,相较于那些原生生物,它的内含子的数量和平均大小与多细胞生物更加相似。

(图S21)(1,17)。

只有1.5%的内含子较短(<100 bp),在大多数真核生物中,我们并没有观察到双峰粒度分布较典型的内含子。

(图21A)。

此外,30%的比较长的内含子是由重复序列所造成的(1),这表明衣藻内含子受到了转座因子创建或入侵。

基因家族。

我们确定了1226个在衣藻中编码两种或两种以上的蛋白质的基因家族(1);其中,有26家族包括10个或更多的成员(表S7)。

317的798个双基因的基因家族中有317个的基因被串联布置,这表明基因串联重复现象广泛存在。

G ene f a m ilies contain s imilar p roportion s of the t ota l gene com-plement o f Chlamyd o mo nas, human, and Arab i-dopsis.在拟南芥中,衣藻是拥有激酶和细胞色素P-450S的大家族,但最大的是三级鸟苷酸和腺苷环化酶家族。

拥有着51名成员,衣藻的家庭比任何其他生物都大。

虽然在植物中未发现这些环化酶,但在动物体内它们参与催化合成cGMP和营(18),这些物质在不同的信号转导途径中作为第二信使。

环状核苷酸对于衣藻交配过程及其鞭毛的功能和调节具有很重要的作用(19–21),并也可能对它适应不断波动的营养条件也有重要的作用(22,23)。

衣藻也会编码不同家族的对于获取养分来说很重要的蛋白质。

转运蛋白。

衣藻中的转运蛋白补体表明了它保留了源自动植物共同的祖先的多样性(23,24)。

衣藻预测有486种膜转运蛋白(图。

S22、S23)(1)共分为61大类离子通道,其中124种与主动运输(消耗三磷酸腺苷(ATP))有关,293种与被动运输有关;有八类是未被分类的。

总体而言,衣藻中转运蛋白的补体与streococcus(链球菌)和陆地生植物中的都很像。

此外,衣藻基因组也编码
一些在动物中没有被发现过的植物转运蛋白。

(图S22和表S8)
我们还发现,编码那些与动物有关的转运蛋白类的基因的复制行为,包括一些与鞭毛的功能有关的活动。

一部分转运蛋白会参与细胞内钙离子的重新分配来作为对外界环境的一种回应,例如光照。

改变钙离子的浓度可以调节那些只在动物中发现而却没有在维管束植物中发现的鞭毛结构的活动。

衣藻基因组还编码多种的具有底物特异性的转运蛋白,这对于使它能够适应外界环境波动具有很重要的作用,尤其是在土壤营养匮乏的条件下。

在那八种硫酸盐转运蛋白中,四种是H + / SO4 2-家族的,三种是Na + / SO4 2-家族的,还有一种是细菌的ABC型SO4 2-的转运蛋白。

12个坑磷酸盐转运蛋白和6个库普钾通道家族比其他的单细胞真核生物更大,和前者经历了一个谱系特异性的扩张。

沙眼杆菌有11个AMT铵转运蛋白,这在数量上仅次于水稻。

基因组学与衣藻基因的起源。

为了探索衣藻的进化史,我们刚开始把衣藻的蛋白质组与具有代表性的动物(人类)和植物(拟南芥)的蛋白质组做了比较。

我们绘制出最佳的匹配,并以BLASTP(为探索收集蛋白质提供帮助的一种搜索工具)为基础计算每一个莱茵蛋白在拟南芥和人类蛋白质组中的得分。

相较于人类的蛋白质,大多数衣藻蛋白质更偏向于与拟南芥蛋白质相似。

许多衣藻的蛋白质与动物的同系物的相似性更多的表现在鞭毛以及基体的蛋白质上(图4A和低)。

这与动物中鞭毛以及基体纤毛和中心粒的保持是一致的,但在被子植物中却消失了。

在衣藻的蛋白质中,有2489个蛋白质与来自拟南芥和人类的蛋白质属于同源蛋白。

衣藻与人类共享706种蛋白质家族(774种和806种的蛋白质,分别),但这些都没有被与拟南芥分享过,这些在编码纤毛和中心体蛋白的基因序列中站位较多的基因在在绿色植物中要么已经丢失要么偏离得太远以至于难以被识别出来。

相反,在莱茵和拟南芥发现的1879个蛋白质家族
(1968个和2396个的蛋白质,分别),与人类相比却缺乏与衣藻的蛋白质具有同源性的是植物,而不是动物,存在于动植物的共同祖先那里的蛋白质被保留在衣藻和被子植物中,但在动物那里却丢失或偏离了
绿色植物和红藻类的质体属于原生质体,即来自与初级氰基细菌内共生体的后代。

硅藻,褐藻,和含叶绿素a–和c–的藻类也会进行光合作用,但它们进行光合作用的细胞器是通过次级内共生体获得的(28,29)。

对衣藻基因的研究分析,揭示了植物和动物的最后的共同祖先的一些性质,也确定和辨认了许多与纤毛和质体有关的基因。

这些基因的补足,为我们了解藻类在土壤环境中对营养物质的极端竞争的生活,以及感受纤毛和眼点的作用提供了帮助。

对于衣藻和其他的单细胞的藻类在生态学和生理学上的,以及它们在基因结构和基因作用,以及在土壤生活方式的更多了解,将增加我们应用生物技术去开发这些功能的潜力。

相关主题