当前位置:
文档之家› 基因调控网络的生物信息学研究
基因调控网络的生物信息学研究
录因子结合位点具有保守结构特征, 与 其 结 合 的 转 录 因 子 相 对 应 。这些发现都有助于提高预测的准确性和将新发现的可能结
.30
合位点与转录因子相联系。
45/
基于已有调控元件知识的方法 基于知识的方法主要是收集实 验 研 究 确 认 的 顺 式 和 反 式 作
用元件, 总结其特征, 依据结构特征类似 则 功 能 类 似 的 原 则 来 发 现新的调控元件。这类方法发展出预 测 已 知 转 录 因 子 可 能 结 合 位点的主流数据库和预测方法 .60。这些预测方法有一些共同的缺 陷:为了有足够高的灵敏度,就不可 避 免 地 带 来 很 高 的 假 阳 性 率; 在大规模应用时, 所得结果难以处理 。 这 些 缺 陷 的 根 本 原 因 是结合位点序列短而且具有简并性, 而 且 很 难 通 过 算 法 改 进 来 解决。所以, 新近的研究通过引入多种信 息 来 改 善 预 测 结 果 : 如 或者 引入转录因子之间的相互关系和结合位 点 间 的 结 构 关 系 .60, 结合其他类型的数据来改善预测结果 。 预 测 转 录 因 子 的 方 法 基 于基因组注释,通过新注释蛋白与已 知 转 录 因 子 的 同 源 和 相 似 性或者功能分类来发现新转录因子 .70。基于知识的方法和基于保 守性的方法结合使用可以显著改善预测结果。 用于发现调控元件的生物信息 学 方 法 已 经 取 得 了 良 好 的 结 果, 但还有一些重要问题有待解决。首先 , 没有在时间轴上区分 不同阶段的调控元件相互作用。不同 时 出 现 的 元 件 不 可 能 相 遇 并发生相互作用, 不加区分必定会带来假 阳 性 结 果 ; 而且时间上 协调是调控的关键因素,时间轴调控 是 研 究 调 控 网 络 必 须 解 决 的问题。其次, 只有元件之间相互作用关系并不能深入地解释调 控的机理。调控要兼具灵活和稳定, 不同调控元件间有竞争与合 作的联系, 调控网络的研究需要针对更大的结构和动态模型。这 也是生物信息学研究方法的优势所在。还有, 在不同的内外环境 下, 调控活动有很大的不同, 这就需要结合其他类型的数据( 如
[ 8-2 4#&9+] 7AJ@06</7K GA<O/7PV =G<A76C<=/GV <76GHC7=M<=/G60 7AJ@06<=/GV T=/=G>/7;6<=CHV HKH<A; T=/0/JKV HKG<IA<=C T=/0/JK 生物体的生长发育是复杂的动 态 过 程 , 而 细 胞 是 这 一 过 程 的结构基础和功能单元。单一细胞的分裂 、 决定、 分化和凋亡就 是复杂的动态过程。这些过程如何相互协调, 又如何经由进化形 成现存的结构和生命活动特征, 是生物学研究的关键之一。细胞 的生命活动由调控网络调节。调控功 能 则 是 各 种 结 构 元 件 和 储 存在基因组中的编码和调控信息合作 的 结 果 。 细 胞 中 的 结 构 和 功能元件为各种信号提供传递的通道 和 载 体 , 将 信 号 转 导 至 其 调控的目标; 而基因组则储存完整准确的编码和调控信息。将这 —转录调控就成为调控程序完成的关键。 两者联接的步骤—— 分子生物学实验和新近发展的 高 通 量 技 术 已 经 积 累 了 许 多 转录调控的资料,研究发现细胞的调 控 网 络 中 存 在 重 复 出 现 的 为调控网络结构和进 结构模式和动态特征 ]2^。这些模式的发现 , 化的生物信息学研究建立了基础, 也提出了许多新问题。本文总 结了转录调控网络中结构模式的研究 , 并 且 就 这 些 生 物 信 息 学 研究未来可能的发展, 及其与生物工程技术的衔接进行探讨。 在转录调控中, 和顺 4 类最主要的调控元件分别是反式( <76GHX ) 式( 调控元件, 主要是转录因子及对应的结合位点, 这两者 C=HX ) 和下游的目标基因组成最简单的调控结构 , 这种结构有方向性, 信息由转录因子向目标基因传递。现 有 调 控 网 络 的 实 验 资 料 主 、酿酒酵母( 要来源于对大肠杆菌 ( ,89:&;19:17 94<1) =799:7> 和线虫( 的转录调控 ;4?@9&8 9&;&A1817& ) B7&’4;:7CD1618 &<&(7’8 ) 网络的研究。对转录调控元件的生物 信 息 学 研 究 已 经 进 行 了 很 长时间, 主要集中在发现调控区中保守的 顺 式 调 控 元 件 , 以及依 据已经获得的知识发现新的反式调控元件及其结合位点方面。 现今用于发现顺式调控元件的 方 法 主 要 有 4 类 : 基 于 调 控 元件进化保守性的方法和基于已有调 控 元 件 相 互 作 用 知 识 的 方 出现 法。也有研究者完全依据序列中特定区段( HA_@AGCA ;/<=>) 的频率远远大于随机序列的理论计算 频 率 这 一 现 象 来 发 现 可 能 。在很多情况下, 多种方法结合 具有调控功能的序列基序( ;/<=>) 使用才能为研究者带来良好的结果。
[ 67+)&(*)] FG 6MM7AIAGH=NA @G?A7H<6G?=GJ /> 7AJ@06</7K GA<O/7PH =H <IA PAK </ ?=HC/NA7 <IA ;ACI6G=H; /> CA00 ?AC=H=/G8
?=>>A7AG<=6<=/G 6G? ?ANA0/M;AG< /> C/;M0AQ /7J6G=H;H1 #IAHA GA<O/7PH 67A C/;M7=HA? /> >/@7 ;6=G H<7@C<@760 0ANA0HR 7AJ@06S </7K A0A;AG<H8 ;/<=>H8 ;/?@0AH 6G? J0/T60 GA<O/7P /7J6G=U6<=/G1 .67=/@H 60J/7=<I;H 6G? <//0H I6NA TAAG ?ANA0/MA? </ H<@?K <IA 67CI=<AC<@7A /> 7AJ@06</7K GA<O/7PH1 #IA7A 67A H<=00 H/;A M7/T0A;H <I6< HI/@0? TA H/0NA? =G >@<@7A </ =;M7/NA <IA MA7S #IA H<6G?67? 6G? >/7;6GCA /> M7A?=C<=/G 6T/@< 7AJ@06</7K GA<O/7PH1 %/;A M7/;=H=GJ M7/CAHHAH =G T@=0?=GJ C/;M@<6T0A C=7C@=< ;/?A0H /> 7AJ@S 06</7K GA<O/7PH <I7/@JI AGJ=GAA7=GJ 6G? HKG<IA<=C T=/0/JK ;A<I/?H I6NA TAAG M@T0=HIA? 7ACAG<0K1 ?6<6T6HA /> T=/0/J=C60 ;/?A0H OA7A >/@G?A? =G 499E1 #IA 7AHA67CI 7AH@0<H 7ANA60 <I6< <IA NA7=H=;=0=<@?A /> 7AJ@06</7K C=7C@=< ;/?A0H >/7 7AJ@06</7K GA<O/7PH 6G? 7AC/GH<7@C<=/G /> 7AJ@06</7K C=7C@=<H O=00 TA M/OA7>@0 ;A<I/?/0/J=AH =G <IA /> CA00 ?AC=S H=/G 6G? /7J6G=H; ?ANA0/M;AG<1
212
基于调控元件进化保守性的方法 这一类方法建立在调控区中具 有 功 能 的 序 列 在 进 化 中 受 到
2
发现调控网络的元件的研究方法
调控网络最基本的结构单位是一对相互作用的功能元件。
[ 收稿日期] 499:X92X23 [ 作者简介]田鹏( , 男, 硕士研究生 2W3WX ) [ 通讯作者]梁龙, ( "X;6=0 ) !!‘T=/=G>06T1/7J
!"#"$%#&’()"*+ ,-+-(&*.-+ "$ ,-/01()#&2 3-)4#&5+
!"# $ %&’() * +, -.’/01&) 2"# $3 24’() 5+# $3 %&1/67’(
&GH<=<@<A /> (=/<ACIG/0/JK8 FC6?A;K /> 5=0=<67K 5A?=C60 %C=AGCAH8 (A=L=GJ 2999328 *I=G6
4[:
文章编号 !299WX9994Y499:Z94X94[:X9\
生
物
技
术
通讯Βιβλιοθήκη !"##"$% &’ (&)#"*+’)!),-
./0123 ’/14 56718 499:
综
述
基因调控网络的生物信息学研究
田鹏, 岳俊杰, 梁龙, 黄培堂
军事医学科学院 生物工程研究所, 北京 299932 [ 摘要]调控网络的研究对于深入理解细胞的决定和分化、 多细胞生物的生长发育至关重要。在调控网络中调控元件、 基序 、 组件( 、 网络整体的拓扑学结构等 B 个结构层次进行的研究已经发展出了几类主要方法, 但仍然有些问题需 ( ;/<=>) ;/?@0A ) 要解决。用理论方法及基于生物工程技术和合成生物学中研究成果的方法, 建立调控网络 *=7C@=< 的可计算模型的标准和数 可以切实地解决许多调 据库也在不断发展中。新近的研究还显示, 高拟真度的 *=7C@=< 模型与 *=7C@=< 重建的研究方法联用, 控网络研究中的重要问题。 [ 关键词] 调控网络; 相互作用; 转录调控; 生物信息学; 系统生物学; 合成生物学 [ 中图分类号] D3E: [ 文献标识码] F