当前位置:文档之家› 生物信息学填空题(个人整理)

生物信息学填空题(个人整理)

1、BLAST教案所程序中,哪个方法是不存在的?(D)
A:BLASTP B:BLASTN C:BLASTX D:BLASTQ
2、下列哪个软件不是常用来观察蛋白质结构视图的?(D)
A:AVS B:Chimera C:MICE D:HMM
3、下列哪个不是点突变的类型?(A)
A:染色体畸变 B:错义突变 C:无义突变 D:移码突变
4、基因突变的效应不包括:(C)
A:有利突变 B:中性突变 C:移码突变D:遗传多态现象
5、人类基因组的结构特点不包括:(A)
A:基因进化 B:基因数目 C:基因重复序列 D:基因组复制
6、世界上三大数据库不包括:(B)
A:NCBI B:BLAST C:UCSC D:Ensembl
7、常用序列比对方法错误的是:(C)
A:编辑距离 B:点阵描图 C:局部比对 D:记分模式
8、下列哪个不是蛋白质结构模型?(D)
A:同源性模型 B:折叠识别 C:ab initio折叠 D: MoLScript结构9、下列哪个选项不是微阵列实验设计的内容?(A)
A:贝叶斯网络法 B:对照组的选择 C:重复样本的使用 D:随机化原则10、构建序列进化树的一般步骤不包括:(A)
A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树
11、下列中属于一级蛋白质结构数据库的是:(C)
A. EMBL
B. DDBJ
C. PDB
D.SWISS-PROT
12.蛋白质结构预测分为:(B)
A.一级和三级结构预测 B. 二级和空间结构预测
C. 三级和空间结构预测
D. 二级和三级结构预测
13.数据挖掘的四个步骤不包括下列哪个:(C)
A. 数据选择
B. 数据转换
C. 数据记录
D. 结果分析
14.下列哪项不是生物学研究必备的工具:(A)
A.数据分析B.数据统计C.因素分析D.多元回归分析
15.Linux中rmdir 命令的功能是:(D)
A.改变工作目录 B.删除工作目录
C. 创建目录
D.删除空目录
16.BLAST教案所程序中,哪个方法是不存在的?(D)
A:BLASTP B:BLASTN C:BLASTX D:BLASTQ
17.下列哪个不是蛋白质结构模型?(D)
A:同源性模型 B:折叠识别 C:ab initio折叠 D: MoLScript结构18.人类基因组的结构特点不包括:(A)
A:基因进化 B:基因数目 C:基因重复序列 D:基因组复制
19、下列哪个选项不是微阵列实验设计的内容?(A)
A:贝叶斯网络法 B:对照组的选择 C:重复样本的使用 D:随机化原则20、构建序列进化树的一般步骤不包括:(A)
A:建立DNA文库 B:建立数据模型 C:建立取代模型 D:建立进化树三、填空题
1、数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。

2、按碱基配对原则将DNA分子的遗传信息拷贝到mRNA分子中,称为转录。

3、线粒体基因组含有细胞核基因组之外的遗传信息,有其独特的遗传特点表现为:mtDNA具有半自主性、线粒体基因组所用的遗传密码与核基因的通用密码有所不同、mtDNA呈母系遗传、mtDNA具有异质性与均质性、mtDNA具有阀值效应、mtDNA的进化率极高。

4、分子生物学数据库中的信息可以是DNA序列,保守的DNA结构域、基因组、基因表达、蛋白质序列、蛋白质家族、基因突变、基因多态性和代谢途径。

5、BLAST是一种快速序列比较工具,采用启发式方法根据优化的局部相似性构建比对关系。

6.药物基因组学中的三大技术平台:SNP分型,基因表达芯片和生物信息学7.数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。

8.蛋白质的折叠预测方法:同源性模型,折叠识别和从头开始折叠
9.生物膜的特性:流动性和不对称性
10.分子生物学数据库中的信息可以是DNA序列,保守的DNA结构域、基因组、基因表达、蛋白质序列、蛋白质家族、基因突变、基因多态性和代谢途径。

1. 常用的三种序列格式:NBRF/PIR,FASTA和GDE
2. 初级序列数据库:GenBank,EMBL和DDBJ
3. 蛋白质序列数据库:SWISS-PROT和TrEMBL
4. 提供蛋白质功能注释信息的数据库:KEGG(京都基因和基因组百科全书)和PIR(蛋白
质信息资源)
5. 目前由NCBI维护的大型文献资源是PubMed
6. 数据库常用的数据检索工具:Entrez,SRS,DBGET
7. 常用的序列搜索方法:FASTA和BLAST
8. 高分值局部联配的BLAST参数是HSPs(高分值片段对),E(期望值)
9. 多序列联配的常用软件:Clustal
10. 蛋白质结构域家族的数据库有:Pfam,SMART
11. 系统发育学的研究方法有:表现型分类法,遗传分类法和进化分类法
12. 系统发育树的构建方法:距离矩阵法,最大简约法和最大似然法
13. 常用系统发育分析软件:PHYLIP
14. 检测系统发育树可靠性的技术:bootstrapping和Jack-knifing
15. 原核生物和真核生物基因组中的注释所涉及的问题是不同的
16.检测原核生物ORF的程序:NCBI ORF finder
17. 测试基因预测程序正确预测基因的能力的项目是GASP(基因预测评估项目)
18. 二级结构的三种状态:α螺旋,β折叠和β转角
19. 用于蛋白质二级结构预测的基本神经网络模型为三层的前馈网络,包括输入层,隐含层
和输出层
20. 通过比较建模预测蛋白质结构的软件有SWISS-PDBVIEWER(SWISS—MODEL网站)
21. 蛋白质质谱数据搜索工具:SEQUEST
22. 分子途径最广泛数据库:KEGG
23.聚类分析方法,分为有监督学习方法,无监督学习方法
24. 质谱的两个数据库搜索工具:SEQEST和Lutkefish
二填空题
1生物信息学的发展大致经历了3个阶段,分别为(前基因组时代)(基因组时代)和(后基因组时代)p2
2后基因组时代的标志性工作是(基因组分析)(蛋白质组分析)以及(各种数据的比较和整合)p3
3前基因组时代的标志性工作是(生物数据库的建立)(检索工具的开发)以及(DNA和蛋白质的序列分析)p2
4基因组时代的标志性工作是(基因寻找和识别)(网络数据库系统的建立)以及(交互界面的开发)p2
5遗传图谱的图距单位是(厘摩)代表(1%)的交换值,物理图谱的图距以(物理长度)为单位p155-156 如果两个遗传标记之间的重组率是1%,则他们之间的遗传距离就是(1cM)
6 人类基因组中大小约(3×109)对核苷酸,含(30000)个基因,人类基因组中编码DNA的序列占(10%),junkDNA占()p151
7 人类基因组计划的目标是完成四张图,分别是(遗传图谱)(物理图谱)(序列图谱)和(基因图谱)
8 HGP由(六)个国家完成,我国完成了HGP的(1%,即3号染色体上3000万个碱基)的测序工作。

9蛋白质组分析的关键技术主要有(双向凝胶电泳)和(蛋白质鉴定方法)p183 10国际著名的三大公共核苷酸数据库为(GenBank)(DDBJ)(EMBL)p56
11 Genebank由(NCBI)管理运行,(BLAST)是一种快速检索相似性序列的工具,(Entrez)是一个整合的数据查询系统p56
12最常用的序列相似性查询工具是(BLAST)和(FASTA),两个系统的服务分别由(NCBI)和(EBI)维护p73
13 BLAST系列程序有(序列对位排列)(序列同源性)(相似性记分)和(全局排列)p73
14 NCBI中主要的数据库有(DDBJ )(EMBL)和(GenBank)?
15基因组浏览的数据库主要有()和()?
16蛋白质序列数据库主要有(PIR)和(SWISS-PROT)等,蛋白质结构数据库主要有(PDB)
17生物信息数据库分为(核酸和蛋白质一级结构数据库)(基因组数据库)和(生物大分子三维空间结构数据库)
18生物分子数据库专集每年均在(Nucleic Acids Research)杂志的第一期看出p52
19生物信息学数据常见的数据格式主要有(FASTA)(GenBank)和(SwissProt)等
20生物信息学数据库之间的联系方式有(相似性)和(硬链接)
21真核生物基因内含子一般以(GT)两个基因开始,以(AG)两个基因结束22生物信息学识别基因两种途径为(基因组外显子识别)和(EST策略的基因鉴定)
23人类基因组计划具体任务是建立四张图谱,分别为(遗传图谱)(物理图谱)(序列图谱)和(基因图谱)
24建立人类遗传图谱的关键是要有足够的高度多肽的遗传标记。

第一代遗传标
记为(RFLP),第二代遗传标记为(STR),第三代遗传标记为(SNP)。

25大规模基因组测序的基本策略主要有(逐个克隆法)和(全基因组鸟枪法)26距离矩阵法主要有(UPGMA)和(邻接法)
27基因诊断常用技术方法有(核酸分子杂交技术)(PCR技术)和(生物芯片)(基因测序)
28基因治疗的总体策略主要有(基因矫正)(基因置换)(基因增补)(基因失活)29序列比对相似性分支主要取决(取代矩阵)(空位罚分)
30构建系统树的三种主要方法是(距离矩阵法)(最大简约法)(最大似然法)31构建系统树的常用软件(PHYLIP)(TREE-PUZZLE)(MEGA)(PAUP)(课件上还有PAML和TreeView)。

相关主题