目录
生物信息学软件(X10001)………………………………………………………………… 1
生物信息挖掘技术(X10002)……………………………………………………………… 3
功能基因组学(X10003) …………………………………………………………………… 5
统计遗传学研究进展(X10004)……………………………………………………… 7
生物芯片表达谱分析技术(X10005)……………………………………………………… 9
医用多因素分析 (X10006) ……………………………………………………………… 11
医学结构生物信息学(X10007)………………………………………………………… 13
SCI论文与学位论文写作(学院自开课程)……………………………………………… 16 1 生物信息学软件
Bioinformatics software
课程编号: X10001 开课教研室: 生物信息教研室
总学时数: 20学时 学 分: 1学分
主讲教师: 肖 云 开课学期: 第1学期
教材名称: 生物信息学
出 版 社: 人民卫生出版社
出版时间: 2010年 主 编: 李 霞
课程简介:生物信息学软件主要是为研究生开设的基础课。课程内容为生物信息相关专业课程(,课程内容的体系结构涉及功能注释、表达分析以及网络分析等,主要为培养我院各专业研究生灵活运用软件解决问题的能力,使学生通过本课程的学习,能够熟练掌握一些主要的生物信息学软件。
教学目的:该门课程学习的目的,是使学生熟练掌握一些应用广泛的生物信息学软件,并能运用所学软件分析和解决生物信息科研中的实际问题。本课程从多个层面覆盖生物信息各方面常用的软件,如生物学功能注释、系统生物学分析等。本课程重点讲授Cytoscape及其插件的应用。
教学重点及要求掌握的内容:
一、注释软件 Biomart(2学时)
1. 简介 bioMart是一个集成了生物学数据的大型集成数据库,包括Ensemble, Uniprot,
NCBI, EBI, TAIR等常用的数据库
2. 主要功能 它可以轻松地完成的在多个生物学数据库上繁琐地检索,获取相关数据在不同数据库间的关联。
3. 实例分析 查找某个基因在染色体上的位置。反之,给定染色体每一区间,返回该区间的基因s
二、功能分析软件 David(2 学时)
1. 主要功能 主要用于基因的功能富集分析,包括GO富集分析以及KEGG通路富集分析.
2. 实例分析 给定某一基因集合,分析其显著参与的生物学过程 2 三、网络可视化与分析软件 Cytoscape及其插件(16学时)
1. 简介 Cytoscape是一个开源的生物信息软件平台,它可以对分子互作网络及生物学通路进行可视化分析,并且可以根据需要将网络相关的注释信息、基因表达谱和其他类型的数据整合到网络中。
2. 主要功能
a) 可视化蛋白质互作、转录调控网络
b) 对网络进行基础分析,如度,聚类系数等
c) 对网络进行模块划分
3. 实例分析 从任意一互作数据库中下载互作数据,并从GEO上下载一套case/control表达谱数据进行差异表达分析,最后利用软件把差异表达基因在映射到互作网络中并进行可视化。
4. 插件介绍 BiNGO,APCluster,MCODE,OmicsAnalyzer,NetworkAnalyzer,RandomNetworks
参考书目及文献:
1. Durinck, S., Moreau, Y., Kasprzyk, A., Davis, S., De Moor, B., Brazma, A. and Huber, W.
(2005) BioMart and Bioconductor: a powerful link between biological databases and
microarray data analysis, Bioinformatics, 21, 3439-3440.
2. Maere, S., Heymans, K. and Kuiper, M. (2005) BiNGO: a Cytoscape plugin to assess
overrepresentation of gene ontology categories in biological networks, Bioinformatics, 21,
3448-3449.
3. Shannon, P., Markiel, A., Ozier, O., Baliga, N.S., Wang, J.T., Ramage, D., Amin, N.,
Schwikowski, B. and Ideker, T. (2003) Cytoscape: a software environment for integrated
models of biomolecular interaction networks, Genome Res, 13, 2498-2504.
4. Xia, T. and Dickerson, J.A. (2008) OmicsViz: Cytoscape plug-in for visualizing omics data
across species, Bioinformatics, 24, 2557-2558. 3 生物信息挖掘技术
Biological Data Mining Techniques
课程编号: X10002 开课教研室: 生物信息学教研室
总学时数: 20学时 学 分: 1学分
主讲教师: 李霞 开课学期: 第1学期
教材名称: 生物信息学
出 版 社: 人民卫生出版社
出版时间: 2010年 主 编: 李霞
课程简介:随着基因组、蛋白质组及转录组研究的不断进展,各级各类的生物学数据库相继出现,从而产生了高通量、大规模的生物学数据。本课程主要介绍在对对这些生物分子信息进行获取、管理之后如何进行分析和应用,并采用数据挖掘技术从海量数据中发现有价值的规律,揭示其生物学奥秘。同时介绍了R语言中的部分软件包在生物信息挖掘技术上的实现。
教学目的:通过本课程学习,使学生深入掌握生物信息挖掘的基础理论和基本技术,熟悉生物数据挖掘领域的发展趋势,了解生物数据挖掘技术的最新进展和前沿成果,并能根据实际问题给出相应的解决方案。
教学重点及要求掌握的内容:
一、生物信息挖掘方法概述(2学时)
1.决策树与决策森林
2.ANN
3.SVM
4.遗传算法
5.常见聚类方法
6.常见统计学分析方法
7.常见的生物学网络构建方法
二、生物信息学挖掘方法应用(10学时)
1.疾病相关基因与疾病基因子网挖掘新方法
(1)集成决策的方法挖掘疾病相关基因
(2)遗传算法与SVM耦合的方法挖掘疾病基因 4 (3)启发式搜索算法挖掘疾病基因子网
2.生物学模块挖掘方法
(1)基于群体的概率学习方法挖掘microRNA–mRNA调控模块
(2)模块方法整合分析基因表达和药物反应数据
3.药物-靶挖掘方法
(1)整合化学结构与基因组序列信息预测药物-靶的互作网络
(2)药物-靶互作网络
三、R语言实现(8学时)
1.集成决策的方法 party可以用于递归划分计算工具包的核心是ctree(),条件推理树的实现是把基于树的回归模型嵌入到研究很好的条件推理过程理论。这个非参数的回归树可以应用于各种回归模型:包括名义上、顺序、数值的,检查以及多变量和协变量的任意度量。基于条件推论树,cforest()实现了Breiman的随机森林。mob()实现了基于参数模型(如线性模型,广义线性回归或生存分析)递归划分,该方法利用参数不稳定检验来检测划分选择。可以对基于树回归模型可视化。
2.SVM方法 e1075包中SVM是用来训练支持向量机的方法,它可用于一般回归和分类,还可以用于密度估计。
参考书目及文献:
1. Li X, Rao S, Wang Y, Gong B (2004) Gene mining: a novel and powerful ensemble decision
approach to hunting for disease genes using microarray expression profiling. Nucleic Acids Res
32: 2685-2694.
2. Li L, JIang W, Li X, Moser KL, Guo Z, et al.(2005) A robust hybrid between genetic algorithm
and support vector machine for extracting an optimal feature gene subset. Genomics 85:16-23.
3. Chuang HY, Lee E, Liu YT, Lee D, Ideker T (2007) Network-based classification of breast
cancer metastasis. Mol Syst Biol 3: 140.
4. Joung JG, Hwang KB, Nam JW, Kim SJ, Zhang BT (2007) Discovery of microRNA-mRNA
modules via population-based probabilistic learning. Bioinformatics 23: 1141-1147.
5. Kutalik Z, Beckmann JS, Bergmann S (2008) A modular approach for integrative analysis of
large-scale gene-expression and drug-response data. Nat Biotechnol 26: 531-539.
6. Yamanishi Y, Araki M, Gutteridge A, Honda W, Kanehisa M (2008) Prediction of drug-target
interaction networks from the integration of chemical and genomic spaces. Bioinformatics 24:
i232-240.
7. Yildirim MA, Goh KI, Cusick ME, Barabasi AL, Vidal M (2007) Drug-target network. Nat
Biotechnol 25: 1119-1126.
8. Klipp E, Wade RC, Kummer U(2010) Biochemical network-based drug-target prediction. Curr
Opin Biotechnol.