真核生物的基因结构
真核生物的基因结构包括编码区和非编码区。
编码区其实是断裂基因结构,也就是不连续基因。
具有蛋白编码功能的不连续DNA 序列称为外显子,
外显子之间的非编码序列为内含子。
每个外显子和内含子接头区都有一段高度保守的一致序列,即内含子5’末端大多数是GT 开始,3’末端大多是AG 结束,称为GT-AG 法则,是普遍存在于真核基因中RNA 剪接的识别信号。
第一个外显子首端和最后一个外显子末端,分别为翻译蛋白的起始密码子和终止密码子。
====================================================== =======
首位和末位外显子两侧的区域为非编码区,也可以叫做侧翼序列,侧翼序列中包含一些调控元件,比如启动子、终止子,还可能有增强子。
上游侧翼序列包含启动子区域,启动子区域包含:
列为TATAATAAT,是RNA聚合酶的重要的接触点,它能够使酶准确地识别转录
止密码子之间区域,不编码蛋白质。
miRNA 经常结合于3‘UTR,从而引起mRNA。