当前位置:文档之家› 生物信息学实验指导书_新版本

生物信息学实验指导书_新版本

生 物 信 息 学
实 验 指 导 书
重庆邮电大学

生物信息学实验指导书
生物信息教学部 谭军 编
重庆邮电大学生物信息学院
前言
生物信息学是上世纪90年代初人类基因组计划(HGP)依
赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来
的生物学、数学和计算机信息科学的一门交叉应用学科。目前生
物信息学的研究领域主要包括基于生物序列数据的整理和注释、
生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知
识等领域。生物信息学作为新型交叉应用学科,可以依托本校已
有的计算机科学、信息学、生物学和数学等学科优势,充分展现
投入少、见效快、起点高的特色,推动学校学科建设和本科教学
水平。
本实验指导书中的8个实验均设计为综合性开发实验,面向
生物信息学院全体本科学生和研究生,以及全校对生物信息学感
兴趣的其他专业学生开放。生物信息学实验室将提供系统的保
障,包括采用mail服务器和linux帐号管理等进行实验过程管
理和支持。限选《生物信息学及实验》的生物技术专业本科生至
少选择其中5个实验,并不少于8个学时,即为课程要求的0.5
个学分。其他选修者按照课时和学校相关规定计算创新学分

实验一 熟悉生物信息学网站及其数据的
生物学意义

实验目的:
培养学生利用互联网资源获取生物信息学研究前沿和相关数据的能力,熟
悉生物信息学相关的一些重要国内外网站,及其核酸序列、蛋白质序列及代谢途
径等功能相关数据库,学会下载生物相关的信息数据,了解不同的数据文件格式
和其中重要的生物学意义。
实验原理:
利用互联网资源检索相关的国内外生物信息学相关网站,如:NCBI、
SANGER、TIGR、KEGG、SWISSPORT、Ensemble、中科院北京基因组研究
所、北大生物信息学中心等,下载其中相关的数据,如fasta、genbank格式的
核算和蛋白质序列、pathway等数据,理解其重要的生物学意义。
实验内容:
1. 浏览和搜索至少10个国外和至少5个国内生物信息学相关网站,并描
述网站特征;
2. 下载各网站的代表性数据各10条(组)以上,并说明其生物学意义;
3. 讨论各网站适合做何种生物信息学研究的平台,并设计一个研究设想。
实验报告:
1. 各网站网址及特征描述;
2. 代表性数据的下载和生物学意义的描述;
3. 讨论:这些生物信息学相关网站的信息资源,可以被那些生物信息学
研究所利用。
参考书目:
《生物信息学概论》 罗静初 等译, 北京大学出版社, 2002;
《生物信息学手册》 郝柏林 等著, 上海科技出版社, 2004;
《生物信息学实验指导》 胡松年 等著, 浙江大学出版社, 2003。
实验二 利用BLAST进行序列比对
实验目的:
了解BLAST及其子程序的原理和基本参数,熟练地应用网络平台和Linux
计算平台进行本地BLAST序列比对,熟悉BLAST结果的格式和内容并能描述其
主要意义,同时比较网上平台和本地平台的优缺点。
实验原理:
利用实验一下载的核算和蛋白质序列,提交到NCBI或者其他拥有BLAST
运算平台的网页上,观察其基本参数设定库文件类型,并得到计算结果;同时在
本地服务器上学会用formatdb格式化库文件,并输入BLAST命令进行计算,
获得结果文件。
实验内容:
1. 向网上BLAST服务器提交序列,得到匹配结果;
2. 本地使用BLAST,格式化库文件,输入命令行得到匹配结果;
3. 对结果文件进行简要描述,阐述生物学意义。
实验报告:
1. 阐述BLAST原理和比对步骤;
2. 不同类型BLAST的结果及其说明;
3. 讨论:不同平台运行BLAST的需求比较。
参考书目:
《生物信息学概论》 罗静初 等译, 北京大学出版社, 2002;
《生物信息学实验指导》 胡松年 等著, 浙江大学出版社, 2003;

http://www.ncbi.nlm.nih.gov/Education/BLASTinfo/information3.html。

实验三 利用ClustalX(W)进行
多序列联配
实验目的:
掌握用Clustal X(W)工具及其基本参数,对具有一定同源性和相似性的核
酸与蛋白质序列进行联配和聚类分析,由此对这些物种的亲缘关系进行判断,并
且对这些序列在分子进化过程中的保守性做出估计。
实验原理:
首先对于输入的每一条序列,两两之间进行联配,总共进行n*(n-1)/2
次联配,这一步通过一种快速的近似算法实现,其得分用来计算指导树,系统树
图能用于指导后面进行的多序列联配的过程。系统树图是通过UPGMA方法计
算的。在系统树图绘制完以后,输入的所有序列按照得分高低被分成n-1个组,
然后再对组与组之间进行联配,这一步用Myers和Miller算法实现。
实验内容:
1. 明确软件所支持的输入文件格式,搜集整理出合适的数据;
2. 在Windows环境运行Clustal X,在Linux环境运行Clustal W;
3. 实验结果及分析,用TREEV32或Njplotwin95生成NJ聚类图。
实验报告:
1. 整理好的符合Clustal的序列数据;
2. 提交数据网页记录和各步骤记录;
3. 提供聚类图和多序列联配图,并说明意义。
参考书目:
《生物信息学概论》 罗静初 等译, 北京大学出版社, 2002;
《生物信息学实验指导》 胡松年 等著, 浙江大学出版社, 2003。
实验四 ESTS分析
实验目的:
熟悉使用一系列生物信息学分析工具对测序得到ESTs序列数据进行聚类
处理,由此对获得表达基因的丰度等相关信息,并且对这些表达基因进行功能的
初步诠释,为后续实验通过设计RACE引物获得全长基因,以及进一步的功能注
释和代谢途径分析做好准备。
实验原理:
首先用crossmatch程序去除ESTs原始序列中的载体成分和引物成分,然
后用phrap生成congtig和singlet,用blast程序进一步将有同源性的contig
和singlet进行功能聚类,最后通过blast对聚类获得的cluster进行功能注释。
在实验过程中将用到一些本实验室写好的perl程序用于连接各数据库和工具软
件。
实验内容:
1. 运行CodonCode Aligner程序,并用它建立工程文件,导入例子文
件夹里面的数据;练习对序列的各种查看方式。
2. 使用CodonCode Aligner程序里的Clip Ends, Trim Vector,
Assemble等功能,完成序列的剪切、去杂质、组装工作。
实验报告:
1. 实验各步骤记录和中间结果文件;
2. 举例简要说明结果文件中数据的生物学意义。
参考书目:
《生物信息学概论》 罗静初 等译, 北京大学出版社, 2002;
《基因表达序列标签(EST)数据分析手册》 胡松年 等著, 浙江大学出
版社, 2005。
实验五 利用Primer Premier5.0设计
RACE引物

实验目的:
熟悉PCR引物设计工具Primer Premier5.0的一些基本功能,能够根据实
验需要选择相应的引物设计方法设计PCR引物。
实验原理:
PCR实验是当代分子生物学的基本实验之一,由于目标序列和实验目的的
不同,相应设计引物的要求也不一样。本实验延续ESTs分析结果,对于其中需
要获得全长的基因进行RACE引物的设计,及5’和3’RACE引物,配合接头序
列设计单向引物,并模拟练习通过连接获得全长的基因CDS序列。最后设计已
知全长基因序列的PCR扩增引物。
实验内容:
1. 从网站下载并安装Primer Premier5.0;
2. 从 GenBank 中任意获取一个 DNA 序列,设计出该序列的合适引
物;

相关主题