当前位置:文档之家› 最新生物信息学考试复习

最新生物信息学考试复习

——古A.名词解释1. 生物信息学:广义是指从事对基因组研究相关的生物信息的获取,加工,储存,分配,分析和解释。

狭义是指综合应用信息科学,数学理论,方法和技术,管理、分析和利用生物分子数据的科学。

2. 基因芯片:将大量已知或未知序列的DNA片段点在固相载体上,通过物理吸附达到固定化(cDNA芯片),也可以在固相表面直接化学合成,得到寡聚核苷酸芯片。

再将待研究的样品与芯片杂交,经过计算机扫描和数据处理,进行定性定量的分析。

可以反映大量基因在不同组织或同一组织不同发育时期或不同生理条件下的表达调控情况。

3. NCBI:National Center for Biotechnology Information.是隶属于美国国立医学图书馆(NLM)的综合性数据库,提供生物信息学方面的研究和服务。

4. EMBL:European Molecular Biology Laboratory.EBI为其一部分,是综合性数据库,提供生物信息学方面的研究和服务。

5. 简并引物:PCR引物的某一碱基位置有多种可能的多种引物的混合体。

6. 序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。

7. BLAST:Basic Local Alignment Search Tool.是通过比对(alignment)在数据库中寻找和查询序列(query)相似度很高的序列的工具。

8. ORF:Open Reading Frame.由起始密码子开始,到终止密码子结束可以翻译成蛋白质的核酸序列,一个未知的基因,理论上具有6个ORF。

9. 启动子:是RNA聚合酶识别、结合并开始转录所必须的一段DNA序列。

原核生物启动子由上游调控元件和核心启动子组成,核心启动子包括-35区(Sextama box)TTGACA,-10区(Pribnow Box)TATAAT,以及+1区。

真核生物启动子包括远上游序列和启动子基本元件构成,启动子基本元件包括启动子上游元件(GC岛,CAAT盒),核心启动子(TATA Box,+1区帽子位点)组成。

10. motif:模体,基序,是序列中局部的保守区域,或者是一组序列中共有的一小段序列模式。

11. 分子进化树:通过比较生物大分子序列的差异的数值重建的进化树。

12. 相似性:序列比对过程中用来描述检测序列和目标序列之间相似DNA碱基或氨基酸残基序列所占的比例。

13. 同源性:两个基因或蛋白质序列具有共同祖先的结论。

14. 非编码RNA:是指没有编码蛋白质功能的所有RNA,它缺乏ORF,常有编码蛋白质的基因反义转录而来。

15. miroRNA:是含有茎环结构的miRNA前体,经过Dicer加工之后的一类非编码的小RNA分子(21-23 nt)。

16.RNAi:是指在进化过程中高度保守的、由双链RNA(double-stranded RNA,dsRNA)诱发的、同源mRNA高效特异性降解的现象。

是一种转录后水平的基因沉默(PTGS)B.简答题1.生物信息学研究内容。

答:(1)生物信息的收集、存储、管理和提供。

(2)基因组序列信息的提取和分析。

(3)功能基因组分析。

(4)生物分子设计。

(5)药物设计。

(6)生物信息分析的技术与方法研究。

(7)应用与发展研究。

(8)系统生物学研究。

2.生物信息学的应用。

答:(1)人类基因组计划。

(2)人类蛋白质组计划。

(3)新药开发中的应用。

(4)基因芯片。

(5)医学应用。

3.已测序五个植物物种,属名加种名。

答:(1)Solanum tuberosum 马铃薯(2)Musa acuminata banana 香蕉(3)Solanum lycopersicum 番茄(4)Zea mays 玉米(5)Oryza sativa 水稻(6)Arabidopsis thaliana拟南芥(7)Vitis vinifera 葡萄(8)Brassica rapa 白菜4.已测序五个动物物种,属名加种名。

答:(1)Homo sapiens 人(2)Danio rerio 斑马鱼(3)Mus musculus 小鼠(4)Drosophila melanogaster 黑腹果蝇(5)Caenorhabditis elegans 秀丽隐杆线虫(6)Felis catus 猫(7)Gallus gallus 鸡(8)Apis mellifera 蜜蜂5.画图阐述原核生物基因结构。

6.画图阐述真核生物基因结构。

7.核酸序列分析的应用。

答:(1)常规分析:A.核酸序列检索B.核酸序列组分分析C.序列变换D.限制性酶切分析E.序列注释(2)比对分析:A.BLAST比对B.双序列比对C.多序列比对(3)基因结构的识别:A.ORF识别及其可靠性验证B.重复序列分析C.非编码区及启动子分析D.其它调控位点分析:a.转录因子结合位点分析b.剪接位点分析。

8.如何做比对分析(BLAST)?答:(1)进入NCBI主页,点击BLAST进入BLAST主页。

(2)选择需要比对的类型BLASTN BLASTP BLASTX tBLASTN tBLASTX (3)在序列框中输入需要比对的序列。

(4)选择数据库。

(5)开始比对。

9.基因结构识别包括哪些内容?答:(1)ORF识别及其可靠性验证(2)非编码区及启动子区分析(3)基因组重复序列分析(4)其它调控位点分析:a.转录因子结合位点分析b.剪接位点分析。

10.蛋白质序列的基本性质分析包括哪些内容?答:(1)理化性质分析(2)亲水性/疏水性分析(3)跨膜区分析(4)信号肽预测(5)Coil 区分析(6)亚细胞定位(7)结构功能域分析11.蛋白质空间结构怎么预测,二级/三级。

答:(1)二级结构预测:使用SSPro 4.0或PORTER进行分析预测。

(2)三级结构预测:主要方法有同源模建、折叠识别和从头预测。

目前主要使用同源模建的方法来预测蛋白质三级结构,但是需要二个蛋白质序列同源性高于35%,低于30%结构不理想。

具体步骤为,a.进入SWISS-MODEL主页b.选择Automated Mode进入c.在序列框中输入蛋白质序列d.确认进行预测12.如何判断一个新的基因?答:(1)从一个新蛋白质序列开始,通过tBLASTn搜索核酸数据库,找到相应的匹配,如果是和DNA编码的已知蛋白质匹配,则可能不是新的基因;但是如果找到与DNA编码的相关蛋白质的匹配,则有可能是新的基因。

(2)然后进一步通过BLASTx或BLASTp在核酸,蛋白数据库中搜索DNA或蛋白质序列来进一步确定新的基因。

13.进化树构建过程,方法。

答:(1)进行多序列比对,确定序列之间的相似性。

(2)选择合适的建树方法。

a.序列有很高相似性时,选择最大简约法(MP)。

b.序列较高的相似性时,选择距离法,包括邻接法(NJ)。

c.序列相似性很低,选择最大似然法(ML)。

(3)使用软件建树。

a.选择MP法,使用PAUP、MEGA、或PHYLIP。

b.选择NJ法,使用PHYLIP、MEGA、或ClustalX。

c.选择ML法,使用PHYML或BioEdit。

(4)用软件评估进化树。

14.RNAi的原理。

答:(1)外源进入生物体的双链RNA(dsRNA)被一种核糖核酸酶Dicer所识别并将其切割成21~23nt的小干扰RNA(siRNA)。

(2)这种siRNA可以被RISC(RNA诱导的沉默复合物)所识别并结合,进而使siRNA发生解旋和解链。

(3)然后再siRNA反义链的引导下,寻找与siRNA具有同源序列的内源靶mRNA。

(4)RISC与内源靶mRNA同源区进行特异性结合,并切割靶mRNA,导致转录后基因沉默。

(5)siRNA不仅能引导RISC切割靶mRNA,而且可作为引物与靶mRNA结合并以mRNA为模板,在RdRP(RNA依赖的RNA聚合酶)作用下合成更多新的dsRNA,新合成的dsRNA再由Dicer切割产生大量次级siRNA,从而使RNAi的作用放大,最终将所有靶mRNA降解,导致基因的完全沉默。

15.RNAi载体构建过程。

16.高效siRNA设计步骤。

答:(1)靶基因鉴定(2)建立分析(3)序列过滤(4)序列翻译分析(5)获得序列(6)序列比对(7)选取序列(8)合成siRNA。

17.给定miRNA序列,怎么研究其功能?答:(1)上调miRNA在细胞中的含量而获得gain-of-function模型,具体可以将miRNA 的前体序列或成熟序列克隆到专门表达短片段RNA的特殊载体中。

(2)下调miRNA在细胞中的含量或直接抑制该miRNA的功能获得loss-of-function模型。

结合上调和下调结果可以确定基因的表达是否受到特定miRNA的调控。

C.论述题1.构建表达载体:①融合表达载体GUS GFP,并说明用途。

答:A. GUS基因编码β-葡萄糖酸酶,能够催化底物产生荧光物质或者蓝色产物。

可以利用GUS基因与目的基因融合表达来筛选转化子,也可用于外源基因表达产物在转化生物体中的定位分析。

B.GFP基因编码绿色荧光蛋白,在紫外光照射下发出荧光。

可以利用GFP基因和目的基因融合表达在荧光显微镜下观察目的基因编码蛋白的动态变化,筛选转化子,也可用于外源基因表达产物的定位分析。

C.构建步骤:(1)对目的基因cDNA和GUS,GFP进行限制性酶切分析,找出目的基因编码区,GUS基因编码区,GFP编码区中的酶切位点,排除这些酶切位点。

(2)选择合适的载体,如pET系列(原核)或者pCAMBIA 系列(植物)等,并找出被排除以外的酶切位点,选择3个酶切位点。

(3)设计引物扩增目的基因,GUS基因,GFP基因,如果没有选择的酶切位点,则在引物中引入酶切位点。

融合表达在前的基因终止密码子在设计引物时去掉,二个基因连接区要保证引物扩增的产物不会破坏ORF框架即起始密码子前扩增区段要保证为3联体密码。

(4)先连接目的基因与GFP或者GUS,再将融合基因与载体连接。

2.怎么样降低,升高基因的表达。

答:A.降低基因表达:设计siRNA干涉该基因的表达。

步骤:(1)选择欲干涉的靶基因的片段位置,并列出候选siRNA序列。

(2)评估候选siRNA序列,如SNP,形式功能,高级结构等。

(3)进行BLAST比对,排除与非靶基因互补的候选siRNA序列。

(4)从功能特异性角度出发,选择最终siRNA序列。

(5)合成siRNA,包括化学合成,体外转录,构建表达载体等。

(6)转入生物体内。

(7)检测干涉情况。

B.升高基因表达:将该基因转入含有病毒强启动子的载体中使基因超表达。

(以植物为例)步骤:(1)选择超表达载体,即含有病毒强启动子的表达载体。

(2)对目的基因进行限制性酶切分析,排除目的基因编码区具有的酶切位点,选择合适载体具有的酶切位点。

相关主题