当前位置:文档之家› 生物信息学

生物信息学


1.4
生物信息学研究内容
序列比对 (Sequence Alignment) 蛋白质结构预测 计算机辅助基因识别 非编码区分析和DNA语言研究
分子进化和比较基因组学
序列重叠群装配 遗传密码的起源 基于结构的药物设计 基因表达谱分析 ,代谢网络分析 ,基因 芯片设计和蛋白质组学数据分析等
TUBIC
网址: /
CHGC
网址:
/
2.
分子数据库及NCBI序列检索
核酸序列数据
2.1 分子数据类型
生 物 分 子 信 息 生物分子功能数据 复杂 蛋白质序列数据 最基本
生物分子结构数据
直观
2.2
分子数据库 核酸数据库
• IMGT(ImMunoGeneTics数据库含有与免疫系统有
关的核酸序列数据 ) /imgt/
• dbEST (序列表达标记数据库)
/dbEST/index.html
• EPD(真核启动子数据库)
http://www.epd.isb-sib.ch/
Protein Sequence Records from SWISS-PROT and PIR
记录类型
索引号格式
RefSeq Nucleotide Sequence Two letters, an underscore bar, and six Records digits, e.g.: mRNA records (NM_*): NM_000492 genomic DNA contigs (NT_*): NT_000347 complete genome or chromosome (NC_*): NT_000907 genomic region (NG_*): NG_000019 RefSeq Protein Sequence Records Two letters (NP), an underscore bar, and six digits, e.g.: NP_000483
FLYBASE(果蝇基因组数据库)
/
MAIZEDB(玉米基因组数据库)
/
SGD(酵母菌基因组数据库)
/
WORDMPED(蠕虫基因组计划蛋白数据库)
植物分子生物学
生物信息学基础(12学时)
唐玉荣
tangyurong@
主要内容
1. 绪论
2学时(第2周) 4学时(第2周) 2学时(第3周) 2学时(第5周)
2. 分子数据库及NCBI序列检索
3. 双序列比对及BLAST比对工具
4. 多序列比对和分子系统发育
5. 核酸和蛋白质序列分析工具
/Projects/C_elegans/
TIGR(基因组分析研究中心)

其它数据库
OMIM(人类孟德尔遗传学数据库)
/sites/entrez?db=OMIM
基因组数据库
gdb(人类基因组数据库)
/
DICTYDB(盘基网柄菌基因组数据库)
/others/dsmith/dictydb.html
EcoGene(大肠杆菌K12基因组数据库)
/
– All Databases
Entrez检索系统,将科学文献、核酸和蛋白质序列数据 库、蛋白质三维结构数据库、种群研究数据以及全基 因组数据等整合成一个高度集成的系统.
– BLAST
是为了分析核酸和蛋白质数据库而设计的序列相似性 搜索工具
– OMIM
在线人类孟德尔遗传性状数据库,是一个人类基因和遗 传异常的索引
如果文本检索词为:16S RNA
х √
• 检索逻辑词
– AND – OR – NOT
• 数据库记录格式说明
EMBL
ID DE AC SV KW OS OC RN RA RT RL RX RC RP CC DR FH FT SQ 空格
蛋白数据库
SWISS-PROT(蛋白序列数据库) /swissprot/ PIR(蛋白序列鉴定数据库) / PDB(蛋白序列三维立体结构数据库) /pdb/home/home.do PROSITE(蛋白特征序列字典) http://www.expasy.ch/prosite/
是EMBnet和亚太生物信息网络 (APBioNet)的中国节点。
BioSino
网址: /
HKBIC
网址:
.hk/
MBC
网址:
.tw/index.php
Sanger
网址: 主要提供基因组研究相关的数 据与分析工具
SIB
网ห้องสมุดไป่ตู้:
http://www.isb-sib.ch/
ANGIS
网址:
.au/
NIG
网址:
http://www.nig.ac.jp/index-e.html
1.2
生物信息学定义
生物信息学(Bioinformatics): 是一门交叉科学,它包含了生物信息的获 取、处理、存储、分发、分析和解释等在 内的所有方面,它综合运用数学、计算机 科学等工具,来阐明和理解大量生物数据 所包含的生物学意义。
数学
计算机 生物信息学
生物
1.3
生物信息学目标任务
• 收集和管理生物分子数据 • 数据分析和挖掘 • 开发分析工具和实用软件 –生物分子序列比较工具 –基因识别工具 –生物分子结构预测工具 –基因表达数据分析工具
1.5
国内外生物信息网址
美国国家生物技术与信息中心(NCBI) 欧洲分子生物学网络组织(EMBnet)
专业节点: 欧洲生物信息研究所(英国,EBI) Sanger研究所(英国,Sanger) 国家节点: 瑞士 (SIB) 澳大利亚 (ANGIS)
国外
日本国立遗传学研究所(NIG)
• GenBank数据库 –基因组DNA数据库 –对应于表达基因的cDNA数据库 –蛋白质数据库 –表达序列标签(ESTs) –序列标签位点(STS) –基因组测序序列(GSSs) –高通量基因组序列(HTGS)
• 其它核酸数据库
• HIV Database(HIV序列数据库)
/content/index
NCBI
网址: / 包含了公共数据库、生物信 息工具及应用等多种资源。 与很多生物信息软件相关的 站点及资源有链接。
NCBI站点图
EBI
/ 包含了生物数据库、 软件等多种资源,很 多都有相当优秀的使 用指导帮助
国内
北京大学生物信息中心(CBI) 中国科学院上海生命科学研究院生物信息中心 (BioSino) 香港中文大学生物信息中心(HKBIC) 台湾分子生物信息中心(MBC) 天津大学生物信息中心(TUBIC) 国家人类基因组南方研究中心(CHGC)
CBI
网址:
记录类型
GenBank/EMBL/DDBJ Nucleotide Sequence Records
索引号格式
One letter followed by five digits, e.g.: U12345 Two letters followed by six digits, e.g.: AY123456, AF123456 All are six characters: Character/Format 1 [O,P,Q] 2 [0-9] 3 [A-Z,0-9] 4 [A-Z,0-9] 5 [A-Z,0-9] 6 [0-9] e.g.: P12345 and Q9JJS7
PHDP(放射杂交体数据库)
/RHdb/index.html
SRPDB(信号识别位点数据库)
/dbs/SRPDB/SRPDB.html
EMP(酶和代谢途径数据库)
/EMP/
– Books
提供在线的参考书籍
– Structure
提供了分子建模数据库,是一个记录了大分子三维结构, 以及使这些结构可视化和进行比较分析的工具
– TaxBrowser
是一个以组织进行分类的分类信息浏览器
NCBI序列检索方法
1. 以索引号进行检索
索引号是一段由约4-10个数字和字符组成的编码,每个索引 号与一个分子的序列记录相对应
6. Bioinformatics :sequence and genome analysis, David W. Mount, 科学出版社
7. Instant Notes in Bioinformatics (影 印版), 科学出版社
1. 绪论 1.1 生物信息学产生背景
数据和知识的矛盾产生了生物信息学
2.2 NCBI序列检索
网址:/
NCBI资源包括: PubMed All Databases BLAST OMIM Books TaxBrowser Structure
– PubMed PubMed是美国国家医学图书馆提供的搜索服 务,提供了来自MEDLINE和其它相关数据库的 文献记录,同时提供了许多在线期刊的链接.
( NIG, National Institute of Genetics日本国立遗传学研 究所)
NCBI
GenBank
CIB
DNA Databank of Japan
EBI
EMBL Nucleotide Sequence Database
Patent Literature Individual Scientists/Groups Genome Sequencing Centres
以序列索引号进行搜索
• 文本检索
–文本可以是作者名字、杂志名字、基因或 蛋白名、物种等。如:输入RBP4
• 检索结果选项
–Limits 用来在检索中对检索做出各种附加的限制 –Previes/Index 允许检索者浏览最后三次检索的结果 –History 记录使用者做了几次检索,检索了哪些内容 –Clipbord 是一个临时存放检索结果的地方
相关主题