当前位置:文档之家› 生物信息学课件ppt模板

生物信息学课件ppt模板

生物信息学 Bioinformatics
content
• 1.生物信息学简介 • 2.生物信息学数据库 • 3.生物信息学软件 • 4.生物信息学门户网站 • 5.生物信息学在基因芯片技术中的作用
1.生物信息学简介
1.1 生物信息学(Bioinformatics)这一名词的由来 1.2 Bioinformatics的定义 1.3 获取生物的完整基因组 1.4发现新基因和新的核苷酸多态性 1.5基因组中非编码蛋白质区域的结构与功能
模式生物(Model Organism)
Drosophila melanogaster
果蝇
繁殖很快、容易诱发变异的小昆虫。 总长达1.8亿核苷酸。
模式生物(Model Organism)
Arabidopsis thaliana
拟南芥
个体生活周期只有6周的十字花科 小草,是一种理想的模式植物。
模式生物(Model Organism) 小鼠(Mus musculus)
• 这一切构成了一个生物学数据的海洋。
What is Bioinformatics?
如何从海量数据中发掘出人类生存和发展所需的知识,诞生了一门新兴 的交叉科学生物信息学。
6
1.2 定义
广义: 指对基因组研究中的相关生物信息的获取、加工、存储、 分配、分析、和解释。
它包括了两层含义: 一是、对海量数据的收集、整理与服务; 二是、从中发现新的规律。具体来说,生物信息学是把基因组DNA序列信息 作为源头,找到基因组序列中代表蛋白质和RNA基因的编码区,同时阐明基 因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言 规律。在此基础上归纳、整理与基因组遗传信息释放及调控相关的转录普和 蛋白质普的数据,从而认识生物有机体的代谢、发育、分化、进化规律。
• 基因的电脑克隆原理很简单,就是找到属于同一 基因的所有EST片段,再把它们连接起来。由于 EST序列是全世界很多实验室随机产生的,所以 属于同一基因的很多EST序列间必然有大量重复 小片段,利用这些小片段作为标志就可以把不同 的EST连接起来,直到发现了他们的全长,这样 就可以通过电脑克隆到一个基因。
模式生物
Ureaplasma urealyticum
Bacillus subtilis
Drosophila melanogaster
Rickettsia prowazekii
Helicobacter pylori
Buchnerasp. APS
Escherichia coli
human
Arabidopsis
Mycobacteriu m tuberculosis
Genome sizes in nucleotide pairs (base-pairs)
plasmids viruses bacteria fungi plants algae insects mollusks bony fish amphibians reptiles birds mammals
1.1 生物信息学(Bioinformatics)这一名词的由来
八十年代末期,马来西亚的美籍学者林华安 (Hwa A. Lim)认识到将计算机科学与生物学结 合起来的重要意义,开始留意要为这一领域构思 一个合适的名称。
因此不久,他便进一步把它更改为“bioinformatics(或bio/informatics)”。但由于当 时的电子邮件系统与今日不同,名称中的-或/符 号经常会引起许多问题,林博士于是将其去除, “bioinformatics”就正式诞生了,林博士也因此 赢得了“生物信息学之父”的美誉。
• 狭义:采用信息科学技术,借助数学、生 物学的理论、方法,对各种生物信息(包 括核酸、蛋白质等)的收集、加工、储存、 分析、解释的一门学科。
1.3 获取生物的完整基因组
模式生物基因组计划 酵母、线虫、果蝇、细菌、拟南芥等共约50多种已
完成,70余种正在进行。目前总量已达60亿碱基对!
基因组研究的首要目标是获得生物体的基因组全部核苷酸序列。
104 105 106 107 108 109 1010 1011
模式生物(Model Organism)
Escherichia coli 大肠杆菌
Eschericcoli O157:H7
大肠杆菌是研究得最为详尽的一个模式生物。这种 只有1.6微米长的、可以迅速繁殖的单细胞原核生物, 已经成为实验室和基因工程的重要工具。
基因组大小与人类相近,约30亿个核苷酸对;
1.4发现新基因和新的核苷酸多态性
• 发现新基因是当前国际上基因组研究的热 点,使用生物信息学的方法是发现新基因 的重要手段。比如啤酒酵母完整基因组所 包含的基因约6000个,大约60%的基因是 通过信息分析得到的。
1.2.1基因的电脑克隆
• 利用EST数据库发现新基因也被称为基因的 电脑克隆。EST序列是基因表达的短的 cDNA序列,它们携带着完整基因的某些片 段的信息。目前,Genbank的EST数据库 中水稻EST序列已达124万条,拟南芥达80 万条,而人类的EST序列已超过957万余条, 它大约覆盖了人类基因的90%以上。
Thermotoga maritima
Thermoplasma acidophilum
mouse
Caenorhabitis
rat
elegans
Borrelia burgorferi
Plasmodium falciparum
Borrelia burgorferi
Aquifex aeolicus
Neisseria meningitidis Z2491
• 如果这个基因以前未曾发现过,那它就是一个新 基因。
• 20世纪50年代以来,生命科学进入了前所未有的 高速发展阶段,在短短几十年积累了大量的数据。 据不完全统计,目前在国际数据库中记录的DNA 序列的碱基早已超过了100亿;
• 而随着人类和其他模式生物基因组测序的完成, 可以预计今后DNA序列数据的增长将更为惊人;
• 与此同时,蛋白质的一级结构,即氨基酸序列的 数据的积累也随之增加,迄今已测定一万多种蛋 白质的不同分辨率的空间结构。
相关主题