当前位置:文档之家› 生物信息学考点整理

生物信息学考点整理

生物信息学考点整理
1、人类科学史上的三大工程:人类基因组计划、曼哈顿原子计划、阿波罗登月
计划
2、蛋白质的生物学功能:催化功能、运输功能、营养储存功能、收缩和运动功
能、结构功能、防御功能、调控功能。

3、20种氨基酸的结构、特性、英文、电荷:甘氨酸Gly,G、丙氨酸Ala,A、
缬氨酸Val,V、亮氨酸Leu,L、异亮氨酸Ile,I、脯氨酸Pro,P、丝氨酸Ser,S、苏氨酸Thr,T、半胱氨酸Cys,C、蛋氨酸Met,M、天冬酰胺Asn,N、谷氨酰胺Gln,Q、苯丙氨酸Phe,F、赖氨酸Lys,K、酪氨酸Tyr,Y、精氨酸Arg,R、色氨酸Trp,W、组氨酸His,H、天冬氨酸Asp,D、谷氨酸Glu,E。

①极性氨基酸(容易与水分子形成氢键):丝氨酸Ser、苏氨酸Thr、半胱
氨酸Cys、天冬酰酸Asn、谷氨酰胺Glu、组氨酸His、酪氨酸Tyr、色氨酸Trp。

②带电氨基酸:天冬氨酸Asp、谷氨酸Glu(-)、赖氨酸Lys(+)、精氨酸Arg。

③疏水性的氨基酸:丙氨酸Ala、缬氨酸Val、亮氨酸Leu、异亮氨酸Ile、
苯丙氨酸Phe、脯氨酸Pro、蛋氨酸Met。

④甘氨酸Gly侧链只有一个氢原子,是最简单的氨基酸,具有独特的性质,
可以单作为第四类,也可归于第一类。

●芳香族的氨基酸有哪些?
苯丙氨酸Phe、酪氨酸Tyr、色氨酸Trp、组氨酸His
●含硫氨基酸有哪些?
甲硫氨酸、半胱氨酸。

●侧链为醇或酚的氨基酸有?
丝氨酸Ser、苏氨酸Thr、酪氨酸Tyr
●唯一没有手性的氨基酸是?
甘氨酸
4、国际上最常用的蛋白质:
5、核酸序列:就是指DNA或RNA中碱基的排列顺序
6、结构数据库:指在计算机的存储设备上合理存放的相关联的有结构的数据集
合。

一个数据库含有各种成分,包括表、视图、存储过程、记录、字段、索引等。

7、蛋白质结构层次:
●蛋白质的一级结构?指多肽链中氨基酸的顺序。

●蛋白质的二级结构?指多肽链借助于氢键沿一维方向排列成具有周期性
的空间结构。

●蛋白质的三级结构?指肽链中的规则的二级结构和其他无规则的肽段一
起,构成的完整立体结构。

●蛋白质的四级结构?指亚基和亚基之间通过疏水相互作用,结合成为有
序排列的空间结构。

8、基因表达调控物质:
●调控物质的化学本性是?:蛋白质、核酸、小分子化合物
●调控元件有哪些?反式作用因子,顺势作用元件
●什么是基因表达调控的开关?操纵子结构
9、DNA双螺旋中碱基对
10、常用的序列搜索方法
11、NCBI:National Center for Biotechnology Information 美国国立生物技术信息中心
12、序列的同源性:两条序列同源是指它们具有共同的祖先。

13、cDNA:互补脱氧核糖核酸
14、基因:合成有功能的多肽或RNA分子所必须的所有核苷酸序列
15、HGP:人类基因组计划(human genome project)
16、食物源性生物活性肽
17、promoter:启动子,RNA聚合酶特异性识别和结合的DNA序列。

启动子是基因(gene)的一个组成部分,控制基因表达(转录)的起始时间和表达的程度。

18、FASTA:FastA的基本思路是: 识别与代查序列相匹配的很短的序列片段,称为k-tuple。

蛋白质序列数据库搜索时,短片段的长度一般是1-2个残基长;DNA 序列数据库搜索时,通常采用稍大点的值,最多为6个碱基。

通过比较两个序列中的短片段及其相对位置,可以构成一个动态规划矩阵的对角线方向上的一些匹
配片段。

19、FSS:飞行服务站- -、
20、Lactoferrin:乳铁蛋白
21、Bioinformatics:生物信息学
22、GenBank:GenBank是美国国家生物技术信息中心(National Center for Biotechnology Information ,NCBI)建立的DNA序列数据库,从公共资源中获取序列数据
23、Proteomics:蛋白质组学
24、base pair:碱基对
25、EMBL:欧洲分子生物学实验室EMBL(The European Molecular Biology Laboratory)
26、DDBJ:中文名日本DNA数据库
27、FASTA:FASTA程序是第一个广泛使用的数据库相似性搜索程序。

FASTA格式是一种基于文本用于表示核苷酸序列或氨基酸序列的格式
28、GenBank序列格式
29、查询序列
30、序列比对:为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列
31、PDB:(Program Database File,程序数据库文件)
32、回文序列:文序列是双链DNA中的一段倒置重复序列,当该序列的双链被打开后,可形成发夹结构。

这段序列被称为回文序列
33、cccDNA:细胞外乙型肝炎病毒DNA是一种松弛环状的双链DNA(relaxed circularDNA,rcDNA)分子。

cccDNA是乙肝病毒前基因组RNA复制的原始模板
34、基因:合成有功能的多肽或RNA分子所必须的所有核苷酸序列
35、顺势作用元件:存在于DNA上的一些与基因转录调控有关的特殊序列
36、启动子:RNA聚合酶特异性识别和结合的DNA序列。

启动子是基因(gene)的一个组成部分,控制基因表达(转录)的起始时间和表达的程度。

37、基序:也翻译为“模序”,“模体”,DNA,蛋白质等生物大分子中的保守序列,在反式作用因子的结构中,基序一般指构成任何一种特征序列的基本结构(既
指此具功能的基本结构,也指编码此结构的蛋白质/DNA序列)。

38、分子系统发育
39、生物信息学:生物信息学是采用计算机技术和信息论方法研究生命科学中各种生物信息的表达、采集、储存、传递、检索、分析和解读的科学。

40、食品生物信息学
41、蛋白质的各级结构
42、DNA的各种结构:
Entrez: Entrez 是美国国家生物技术信息中心所提供的在线资源检索器。

43、EST:EST文库:是从已建好的的cDNA文库中随机取出一个克隆,从5'或3'端对插入的cDNA片段进行一轮单向自动测序,所获得的一段60-500bp的一段cDNA序列。

44、基因组:是一种生物所有遗传信息的总和,或载有遗传信息的全体核酸。

45、结构基因:结构基因是指编码任何蛋白质或非调控因子的RNA的基因,是操纵子的一部分。

46、基因家族:基因组中存在的许多来源于同一个祖先,结构和功能相似的一组基因。

同一家族的这些基因的外显子具有相关性,可在基因组内集中或分散分布。

47、基因表达的调控:
48、同源蛋白:氨基酸序列具有明显的相似性,在不同生物体或同一机体内行使相同或相似功能的蛋白质。

同源蛋白质具有物种差异性和共同的进化起源。

49、蛋白质同源分析
50、NCBI各种文本格式
51、PubMet检索的四个主要特点:
●词汇自动转换功能
●截词检索功能
●强制检索功能
●链接功能。

相关主题