当前位置:
文档之家› 高中生物竞赛资料-生物信息学 第一章 生物信息学概论高中生物精品公开课
高中生物竞赛资料-生物信息学 第一章 生物信息学概论高中生物精品公开课
ห้องสมุดไป่ตู้
Drug Discovery
Metabolomics Genomics
生物信息学定义
Bio-informatics bio (biology) + informatics
利用计算机存储、检索、分析、预测生物分子 组成与结构的科学
生物学
数学
计算机科学
生物分子信息
生
生物信息的载体
物
分
子
细 胞
Genome : the “manual of life”
TTGGAAAACATTCATGATTTATGGGATAGAGCTTTAGATCAAATTGAAA AAAAATTAAGCAAACCTAGTTTTGAAACCTGGCTCAAATCGACAAAAGC
GTCCAACTGGGCTGSTACToATCGsGAiATmTGAGpAGAGleAATC,CAyTCAGeGCtGTTCsAAoTTTTmCATTyATAAsTCtTTeTGrACiAAoTCuTCGTsCA…TAGTGAAATATCTATC
生物信息学
生物信息学产生的背景
人类基因组计划的诞生
诺贝尔奖获得者Renato Dulbecco 于1986 年在 Science 杂志上发表了一篇文章名为 “ A turning point in cancer research: Sequencing the human genome”,认为 要彻底阐明癌症的发生、演进、侵袭和转移 的机制,必须对人体细胞的基因组进行全测 序。经过3年多的讨论,美国政府与1990年
10月正式启动了一项耗资30亿美元的15年计 划,预期到2005年完成人类基因组30亿碱基 的全序列测序,这就是被称为生命科学“ 登 月计划” 的人类基因组计划。
Renato Dulbecco
NovaSeq 6000
生物信息学产生的背景
人类基因组计划的诞生
诺贝尔奖获得者Renato Dulbecco 于1986 年在 Science 杂志上发表了一篇文章名为 “ A turning point in cancer research: Sequencing the human genome”,认为 要彻底阐明癌症的发生、演进、侵袭和转移 的机制,必须对人体细胞的基因组进行全测 序。经过3年多的讨论,美国政府与1990年
ATACCTTTGATACATTTGTTATCGGATCTGGAAATCGGTTTGCGCATG C AGCTTCTTTAGCAGTAGCAGAAGCGCCGGCTAAAGCGTATAATCCGCTT
TTATGTAGTC~TCTA2ACCT.9GAGT%GGGTGGoATGTfTAtAGhGAGTeACTAbTTaAAGAsGTeCCsACATeAGACnCCcAGoCCAGdCAeTATAgAGATeTCnGGCTeAGsCT.GACCCTAT
理
5、 蛋白质结构预测
1、 生物分子数据的收集与管
理
基因组 数据库
蛋白质 序列 数据库
EMBL GenBank
DDBJ
SWISS-PROT PIR
蛋白质 结构
数据库
PDB
2、 数据库搜索及序列比
较 搜索同源序列在一定程度上就是通过序列比较寻找相
似序列
序列比较的一个基本操作就是比对(Alignment), 即将两个序列的各个字符(代表核苷酸或者氨基酸残 基)按照对应等同或者置换关系进行对比排列,其结 果是两个序列共有的排列顺序,这是序列相似程度的 一种定性描述
ATCATCTGAAAAATTCACAAACGAGTTTATTAACTCTATTCGTGACAAT AAAGCAGTAGAATTCCGCAACAAATACCGTAATGTAGATGTTTTACTGA
TTGATGA~TA9T7TC.1AA%TTCoTTfAGgCeAnGGoTmAAAeGAwGCeArGeAC“AjCuAAnGkAA”G AATT
存贮、复制、传递和表达 遗传信息的系统
生物信息学主要研究两种信息载体
DNA
蛋白质
生物分子信息的特征
生物分子信息数据量大 生物分子信息复杂 生物分子信息之间存在着密切的联系
生物信息学主要研究内容
1、 生物分子数据的收集与管
理
2、 数据库搜索及序列比较 3、 基因组序列分析 4、 基因表达数据的分析与处
RNA Alternative Splicing of DSCAM1
碱基突变与遗传病
碱基突变与遗传病
Genbank growth
SRA Growth
Bioinformatics
Biology
Medicine
Agriculture
Forestry
Bioinformatics
Proteomics
TTTATGATCTTACGGGGGAAGAGTTAGATGTAAAATTTATTATTCCTCC TAACCAGGCCGAGGAAGAATTCGATATTCAAACTCCTAAAAAGAAAGTC
AATHAAuAmGAaCGnAAgGeGAnGoCAmGAeAThTTaCsCT3C.A1AAbGCilAlTioGCnTAbAAaTsTeCGsA.AG T
TTTCCATACGTTTAATACGCTTCACGAAGAAAGCAAGCAGATTGTCATC TCAAGTGATCGACCGCCGAAAGAAATTCCTACACTTGAAGATCGACTTC
GGTGChTAACeATyCCAGcCCTGoATnTAtGTaATAGiTCnGTGAtGThGTeCTCTrTGeTCAGgTTuTAAAlaCAAAtGAoAArCGyACTCeCAAAleCAAGmCCCGeAGnCACCtAGsGGACTTTTTA GtThTaATtTeCCnAcAAoTdGAeAGinTTsAtTrGuCcTTtTioATnAsTCoGCnCAwAThCeAGnA,TTwGAhTeTCrAeA, AwTAhTTicAhGAGaAnATdTAhGoAAwGGmCGCuAcChTTApTrToteins to make.
10月正式启动了一项耗资30亿美元的15年计 划,预期到2005年完成人类基因组30亿碱基 的全序列测序,这就是被称为生命科学“ 登 月计划” 的人类基因组计划。
Renato Dulbecco
生物信息学产生的背景
人类基因组 计划中测序 的策略:
分级鸟枪测序
生物信息学产生的背景
什么是生物信息学?