当前位置:
文档之家› 第二十五章基因结构分析的基本策略讲解材料
第二十五章基因结构分析的基本策略讲解材料
•NCBI 还 提 供 了 其 他 数 据 库 , 包 括 在 线 人 类 孟 德 尔 遗 传 (OMIM)、三维蛋白结构的分子模型数据库(MMDB)、人 类 基 因 序 列 集 成 ( UniGene ) 、 人 类 基 因 组 基 因 图 谱 (GMHG)、生物门类(Toxonomy) 等数据库
•而FASTA Report格式仅包括检出序列的简要特征描述。
目录
例如:人EPO基因序列检索
•输入关键词,选择合适的程序
目录
•向下拉寻找符合目标的条目
目录
•点击此条打开连接
目录
•向下拉寻找关注的内容
目录
•可以直接拷贝保存相关内容
•凡是连接的地方都可以点击查看
目录
3. NCBI数据库搜索工具
目录
目录
1. 各种数据库的介绍
(1) Nucleotide
•该数据库由国际核苷酸序列数据库成员美国 国立卫生研究院GenBank、日本DNA数据库 (DDBJ)和英国Hinxton Hall的欧洲分子生物学 实验室数据库(EMBL)三部分数据组成 •三个组织每天交换各自数据库中的新增序列 实现数据共享
目录
(2) Genome
•即基因组数据库,提供了多种基因组、完全染 色体、重叠序列图谱以及一体化基因物理图谱
(3) Structures
•即结构数据库或称分子模型数据库(MMDB), 包含来自X线晶体学和三维结构的实验数据
•NCBI 已 经 将 结 构 数 据 交 叉 链 接 到 书 目 信 息 、 序 列 数 据 库 和 NCBI的Taxonomy中运用NCBI的3D结构像
目录
点击核酸序列blast,在框内输入序列:
目录
选择搜索条件:
目录
选择特殊程序:
目录
比较两个序列之间的相似性:
目录
以上仅简介了NCBI相关数据库及工具软 件关于其他数据库及软件工具等信息见书中 第二十五章表1-5。
目录
第二节 基因转录起始点的鉴定
目录
主要内容: 一、基因转录起始点的序列特征 二、基因转录起始点的序列分析
目录
•Entrez:
目录
•BLAST:
目录
•BLAST程序
程序 Blastp Blastn Blastx Tblastn Tblastx
数据库 蛋白质
查询 蛋白质
核苷酸 核苷酸
核苷酸 (翻译)
蛋白质
核苷酸 (翻译)
蛋白质
核苷酸 (翻译)
核苷酸 (翻译)
内容 使用取代矩阵寻找较远的关系: 可以进行SEG过滤 寻找较高分值的匹配,对较远关系 不太适用 对于新的DNA序列和ESTs的分析极 为有用 对于寻找数据库中没有标注的编码 区极为有用 对于分析EST极为有用
检索和比对分析
目录
•基因或DNA序列比对
•就是在数据库中对基因序列或DNA序列进行
比对分析,以其能够推测出其结构、功能及在
进化上的联系.
直接的数量关系
•比对方法: 1. 双重比对 2. 多序列比对
序列比对目的:
•判断两个或多个序列间是 否具有足够的相似性
从而判断二者之间是否具 有同源性
进化上曾具有共同祖先
•其他:书目,杂志,文章引用匹配等
目录
2. NCBI数据库检索
•在检索框中输入检索词,检索词间默认逻辑关 系为AND,检索规则基本同PubMed
•可 以 通 过 下 拉 菜 单 选 择 记 录 的 显 示 格 式 , 通 常 选 择 GenBank Report格式或FASTA Report格式。
目录
目录
•NCBI数据库
NCBI首先创建GenBank数据库
•于 1991 年 开 发 了 Entrez 数 据 库 检 索 系 统 , 该 系 统 整 合 了 GenBank、EMBL、PIR和SWISS-PROT等数据库的序列信息 以及MEDLINE有关序列的文献信息,并通过相关链接,将他 们有机地结合在一起
第二十五章
基因结构分析的基本 策略
Basic strategy for analyzing gene structure
目录
主要内容: 第一节 基因序列结构的生物信息学检索和比对
分析 第二节 基因转录起始点的鉴定 第三节 启动子的结构及功能分析 第四节 编码序列结构分析
目录
第一节 基因序列结构的生物信息学
•当选择GenBank Report格式后,屏幕显示较完整的基因记录,包 括 : 基 因 位 点 (Locus ) 、 基 因 定 义 (Definition ) 、 基 因 存 取 号 (Accession)、 核酸编号(NID )、关键词(Keywords)、 来源 (Source)、组织分类(Organism)、参考文献(Reference)、 著者 (Author ) 、 题 目 (Title ) 、 期 刊 (Journal ) 、 Medline 存 取 号 (Medline)、序列特征(Features)、基因(Gene)、CDS(cDNA)、 等位基因(Allele) 对等的肽(Mat-Peptide )、计算碱基数(Base Count)、原序列(Origin)。
目录
(4) Taxonomy
•即生物学门类数据库,可以按生物学门类进行检 索或浏览其核苷酸序列、蛋白质序列、结构等
(5) PopSet
•包含研究一个人群、一个种系发生或描述人群 变化的一组组联合序列 •PopSet既包含了核酸序列数据又包含了蛋白质 序列数据
目录
(7) 文献数据库
•PubMed:生物医药科学的检索系统 •OMIM:孟德尔遗传学数据库是人类基因和基 因疾病的目录数据库 •该数据库包括原文信息、图片和参考信息, 同 时 还 可 以 链 接 到 Entrez 系 统 MEDLINE 数 据库中相关文献和序列信息
•Entrez:
是一个用以整合NCBI数据库中信息的
搜寻和检索工具 •Entrez的一个强大和独特的特点
•BLAST:
是检索相关的序列,结构,和参考
文献的能力
➢
是一个NCBI开发的序列相似搜索程序,还可作
为鉴别基因和遗传特点的手段 ➢
•NCBI 提 供 的 附 加 软 件 工 具 有 : 开 放 阅 读 框 寻 觅 器 (ORF Finder),电子PCR,和序列提交工具, Sequin和BankIt