当前位置:文档之家› 生物信息学实验

生物信息学实验

生物信息学实验生物信息学实验Bioinformatics Experiment【课程编号】1411010【课程类别】专业方向课【学分数】1学分【适用专业】生物技术、生物科学【学时数】32学时【编写日期】2007年6月一、教学目标本课程旨在使学生了解生物信息学基本知识,掌握生物信息学的基本思路与方法。

把最基本的生物信息学计算技术进行联机学习,突出基础性和实用性,让每个同学通过实际操作来体验复杂的生物学数据及其相关的分析手段。

通过本课程的学习,可以深化学生理解和使用由高通量技术所产生的大量生物信息的生物学背景及其分析方法;同时本课程与专业的需求紧密结合,通过学习,使学生能够快速检索网上信息,从而了解本学科的前言知识;通过学习使学生能够与生物信息大型数据库建立连接,取得已有的数据,从而为自己的研究服务。

二、教学内容和学时分配实验一、Genomic Databases4学时基础性主要内容:UCSC Genome, BrowserNCBI Map, ViewerEnsembl教学要求:了解当前全球三个主要的基因组数据库:UCSC、NCBI和Ensembl。

了解三个数据库共有的特点,以及在可视化、提供的信息、所用到的序列比对工具等方面的不同之处。

以人类胰岛素基因Insulin为例,理解三个数据库是如何注释gene duplication、EST、SNP等基因组信息的。

结合三个数据库的各自特点,掌握如何从数据库中获取与基因相关的序列、三维结构、功能、遗传变异等信息。

重点、难点:三个数据库都涵盖了几乎所有的基因组信息,因此从众多信息中如何获得自己所感兴趣的是本次试验课的重点,也是难点。

其它教学环节:实验课刚开始,授课老师结合ppt,以人类胰岛素基因Insulin为例,讲授本次实验课的主要内容,并布置本次实验作业。

在实验过程中,授课老师提议同一个小组的学生一起讨论,有问题向授课老师或助教提问。

同时,学生可以在论坛中(专门为生物信息学试验课设计的)发表自己的见解、交流学习心得。

实验二、NCBI PubMed4学时基础性主要内容:NCBI PubMed:综合的文献检索数据库,包含了>1600万篇生物化学文章的引文,这些文章来源于MEDLINE和其他生命科学学领域的期刊。

教学要求:了解NCBI的Entrenz系统,一个集成了PubMed、核酸序列、蛋白质序列、三维结构等信息的搜索系统。

了解PubMed 数据库的基本内容。

理解PubMed文献搜索的格式。

三掌握如何在PubMed中按照主题词、作者名、出版年份、研究机构等关键字进行文献搜索。

重点:按照几种主要的关键字进行文献检索难点:按照主题词进行文献搜索。

其它教学环节:实验课刚开始,授课老师结合ppt,讲授本次实验课的主要内容,并布置本次实验作业。

在实验过程中,授课老师提议同一个小组的学生一起讨论,有问题向授课老师或助教提问。

同时,学生可以在论坛中(专门为生物信息学试验课设计的)发表自己的见解、交流学习心得。

实验三、Browsers and Tools for Genetic Variants Analysis4学时基础性主要内容:HapMap Generic Genome Browser, NCBI dbSNPs, Haploview教学要求:了解三者的主要内容,及主要功能。

HapMap phaseI,phaseII是全面的有关人类遗传变异数据库,NCBI dbSNP存储了所有的人类SNP数据,Haploview是通用的LD分析软件。

理解dbSNP所存储的所有人类SNP数据,质量并不是都很可靠的,因此dbSNP为每一个SNP专门设置了“Validation Status”信息。

掌握从HapMap和dbSNP中获取一段染色体片断相关的遗传变异信息。

重点:掌握从HapMap和dbSNP中获取一段染色体片断相关的遗传变异信息。

难点:如何使用Haploview工具进行LD分析。

其它教学环节:实验课刚开始,授课老师结合ppt,以人类BRCA2基因为例,讲授本次实验课的主要内容,并布置本次实验作业。

在实验过程中,授课老师提议同一个小组的学生一起讨论,有问题向授课老师或助教提问。

同时,学生可以在论坛中(专门为生物信息学试验课设计的)发表自己的见解、交流学习心得。

实验四、Genome Databases,Literature Databaseand Genomic Variation Databases4学时综合性主要内容:充分运用所学的各种生命科学知识,各小组独立选题、设计、构思一个以数据库检索为主的训练项目。

教学要求:要求该项目至少使用到人类基因组数据库(和GenBank)、dbSNP和HapMap数据库、文献数据库PubMed、蛋白数据库UniProt等在以前课时中已介绍过的数据库。

所用到的数据(内容实体)必须是有内在联系的生物学研究对象。

了解该项目的生物学研究对象。

理解各个数据库的内容。

掌握该项目中各个数据库之间的联系。

重点:围绕着一个自己感兴趣的生物学研究对象,如蛋白质家族,综合运用核酸、蛋白质、遗传变异、文献各个方面的数据库进行信息检索。

难点:如何解释各数据库的查询结果。

其它教学环节:实验课刚开始,授课老师结合ppt,对之前三次实验课内容作大概的回顾和总结,并布置本次实验作业。

在实验过程中,授课老师提议同一个小组的学生一起讨论,有问题向授课老师或助教提问。

同时,学生可以在论坛中(专门为生物信息学试验课设计的)发表自己的见解、交流学习心得。

实验五、Gene Ontology and SPIDer4学时基础性主要内容:GO(Gene Ontology), SPIDer(Saccharomyces Protein-protein Interaction Database)教学要求:了解(1)GO从生物过程、分子功能和细胞组分三个方面对基因和基因产物进行注释,并以DAG的架构进行组织。

(2)SPIDer是我们小组开发的一个芽殖酵母蛋白质-蛋白质相互作用及可视化检索系统。

理解GO有什么用,它一方面为各个生物学数据库注释基因产物提供了统一化的词汇、结构,另一方面对生物信息学大规模计算、机器学习等提供了统一的基因注释平台。

掌握GO和SPIDer两个数据库的检索,如对于一个感兴趣的蛋白质复合体,在SPIDer中检索这个复合体内部成员之间的相互作用,还可以在GO中检索这个复合体各个成员的注释,并看两者之间是否存在联系。

重点:GO知识架构的组织方式,和GO数据库的检索。

难点:要完成本次实验课的作业,需要将GO和SPIDer这两个分别代表基因注释和蛋白质相互作用的数据库结合起来。

其它教学环节:实验课刚开始,授课老师结合ppt,讲授本次实验课的主要内容,并布置本次实验作业。

在实验过程中,授课老师提议同一个小组的学生一起讨论,有问题向授课老师或助教提问。

同时,学生可以在论坛中(专门为生物信息学试验课设计的)发表自己的见解、交流学习心得。

实验六、BLAST4学时基础性主要内容:BLAST (Basic Local Alignment Search Tool)教学要求:了解什么是BLAST,它有哪些应用,几种常用的BLAST程序包。

理解为什么会有BLAST程序包。

掌握如何在NCBI网站上进行BLAST搜索、如何获取BLAST帮助。

重点:分析、理解BLAST的输出结果和评分标准,如Bit Scores, E-values。

难点:理解BLAST不同参数的含义,以及如何调整和适用情况。

其它教学环节:实验课刚开始,授课老师结合ppt,讲授本次实验课的主要内容,并布置本次实验作业。

在实验过程中,授课老师提议同一个小组的学生一起讨论,有问题向授课老师或助教提问。

同时,学生可以在论坛中(专门为生物信息学试验课设计的)发表自己的见解、交流学习心得。

实验七、Multiple Sequence Alignment and ClustalW/X4学时基础性主要内容:MSA(Multiple Sequence Alignment), ClustalW/X教学要求:了解为什么要MSA(多序列比对),什么是ClustalW,从哪里可以在线使用ClustalW,或下载ClustalX 程序以本地使用。

理解ClustalW的结果可以用于哪些分析。

掌握如何使用ClustalW/X软件,包括输入、主要参数的设定、输出结果分析。

重点:学会ClustalW/X的使用。

难点:分析ClustalW/X的结果,并理解构建出来的系统发育树。

其它教学环节:实验课刚开始,授课老师结合ppt,以16S rRNA 的10条序列为例,讲授本次实验课的主要内容,并布置本次实验作业。

在实验过程中,授课老师提议同一个小组的学生一起讨论,有问题向授课老师或助教提问。

同时,学生可以在论坛中(专门为生物信息学试验课设计的)发表自己的见解、交流学习心得。

实验八、PSI-BLAST And HMMER4学时基础性主要内容:PSI-BLAST(Position-Specific Iterated BLAST),HMMER(Biosequence analysisi using profile hidden markov models),Pfam教学要求:了解什么是PSI-BLAST,HMMER,都分别有哪些应用。

理解(1)PSI-BLAST程序运行的流程,PSSM与iteration的联系。

(2)与BLAST相比,PSI-BLAST有哪些特点。

(3)HMMER与Pfam的联系。

掌握(1)PSI-BLAST 的在线使用,包括输入,结果分析。

(2)Pfam数据库的检索,包括获取蛋白质结构域架构、获取已知蛋白质的三维结构和点击到其他数据库的链接。

重点:学会PSI-BLAST的在线使用,和Pfam数据库的检索。

难点:PSI-BLAST程序的实现过程。

其它教学环节:实验课刚开始,授课老师结合ppt,讲授本次实验课的主要内容,并布置本次实验作业。

在实验过程中,授课老师提议同一个小组的学生一起讨论,有问题向授课老师或助教提问。

同时,学生可以在论坛中(专门为生物信息学试验课设计的)发表自己的见解、交流学习心得。

三、教材与学习资源教材:[1]Bioinformatics-A Practical Guide to the Analysis of Genes and Proteins, 3rd Edition》,AndreasD.Baxevanis (Editor), B.F.Francis Ouellette (Editor). John Wiley & Sons, Inc., Publication. 2004[2]Bioinformatics: Sequence and Genome Analysis》. D. W. Mount. Cold Spring Harbor Laboratory Press. 2001网上公共资源:[1]NCBI (Human) 网站:[2]UCSC (Human) 网站:[3]Ensembl (Human) 网站:[4]PubMed网站:[6]InterPro网站:[7]Gene Ontology网站:本地化数据库资源:[1]Ensembl 本地化数据库:[2]SPIDer本地化数据库:教学课件:[1]Bioinformatics_Experiment_01_Genomic Databases.ppt[2]Bioinformatics_Experiment_02_PubMed.ppt[3]Bioinformatics_Experiment_03_Genetic Variants.ppt[4]Bioinformatics_Experiment_04.ppt[5]Bioinformatics_Experiment_05_GO_SPIDer.ppt[6]Bioinformatics_Experiment_06_Blast.ppt,[7]Bioinformatics_Experiment_07_ClustalW.ppt[8]Bioinformatics_Experiment_08_PSI-blast_HMM.ppt四、先修课要求及教学策略与方法建议先修课要求:计算机基本操作、生物化学或分子生物学(对基因组知识有一定的了解)。

相关主题